首页> 中国专利> 一种基于实时知识处理的智能居家养老看护系统

一种基于实时知识处理的智能居家养老看护系统

摘要

本发明公开了一种基于实时知识处理的居家养老智能看护系统,包括数据采集层,算法与知识服务层以及用户接口层,数据采集层通过物联网传感器得到多维实时数据并进行语义化,所述物联网传感器包括温湿度、烟雾、距离及酸碱度相应传感器,算法与知识服务层利用语义数据流引擎进行高效实时知识查询和推理,所述实时知识查询和推理采用前后向链式相结合的知识推理方式实现;用户接口层显示出推理结果,实现智能居家养老看护。本发明用知识图谱技术可以实现传感器测量信息等动态知识和家庭布局、个人健康史等静态知识相结合的实时知识推理,从而及时准确地进行个性化、有针对性的复杂意外事件监测。

著录项

  • 公开/公告号CN114911902A

    专利类型发明专利

  • 公开/公告日2022-08-16

    原文格式PDF

  • 申请/专利权人 江苏有米云智慧科技有限公司;

    申请/专利号CN202210497654.4

  • 申请日2022-05-09

  • 分类号G06F16/33(2019.01);G06F16/36(2019.01);G06F40/30(2020.01);G06N5/04(2006.01);G06Q50/26(2012.01);

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙) 42222;

  • 代理人严彦

  • 地址 225000 江苏省扬州市经济技术开发区扬子江中路188号A-11F

  • 入库时间 2023-06-19 16:23:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-02

    实质审查的生效 IPC(主分类):G06F16/33 专利申请号:2022104976544 申请日:20220509

    实质审查的生效

说明书

技术领域

本发明属于物理网和知识图谱技术应用于养老看护服务领域,更具体地,涉及一种基于语义数据流处理的居家养老智能看护系统。

背景技术

随着人口老龄化越来越严重,对老人的看护将成为一个大多数家庭需要面对的问题。据统计,我国老年人中,有1.8亿人患有慢性病,其中75%患有一种及以上慢性病,失能、部分失能老年人约4000万;健康预期寿命(68.7岁)远低于预期寿命(2018年77岁),老年人预计有8.3年带病生活,健康老龄化形势不容乐观。因此,研究出一套高效且实用的居家养老看护系统具有重要的现实意义。

物联网技术(Internet of Things,IoT)是指通过信息传感设备,按约定的协议,将任何物体与网络相连接,物体通过信息传播媒介进行信息交换和通信,以实现智能化识别、定位、跟踪、监管等功能。物联网和移动互联网的快速发展方便了人们的生活,而隐藏在其后的是海量的传感器数据以及其他各种类型数据,这些数据具有高速、实时、动态的特征,对这些数据进行分析并且推理出其中隐含的知识具有重要的理论意义和现实意义。将实时数据与知识图谱技术结合起来,并且以RDF(Resource Description Framework)三元组加时间标注的方式进行表示,可以形成实时语义数据流数据。

在面向语义数据流的实时推理引擎方面,早期的语义数据流处理引擎如CQELS

Laser

Cichlid

表1:语义数据流推理现状

[1]D.L.Phuoc,M.Dao-Tran,J.X.Parreira,and M.Hauswirth,A native andadaptive approach for unified processing of linked streams and linked data,inInternational Semantic Web Conference(1),vol.7031of Lecture Notes in ComputerScience,pp.370–388,Springer,2011.

[2]Barbieri D F,Braga D,Ceri S,et al.Continuous queries and real-timeanalysis of social semantic data with C-SPARQL[C]//ISWC Workshop on SocialData on the Web.2009.

[3]E.Thomas,J.Z.Pan,and Y.Ren,TrOWL:Tractable OWL 2Reason-ingInfrastructure,in the Proc.of the Extended Semantic Web Conference(ESWC2010),2010.

[4]J.Z.Pan,Y.Ren,and Y.Zhao,Tractable approximate deduction for OWL,Artif.Intell.,vol.235,pp.95–155,2016.

[5]A.Mileo,A.Abdelrahman,S.Policarpio,and M.Hauswirth,Streamrule:Anonmonotonic stream reasoning system for the semantic web,in RR,2013.

[6]T.Pham,A.Mileo and M.I.Ali,Towards Scalable Non-Monotonic StreamReasoning via Input Dependency Analysis,2017IEEE 33rd InternationalConference on Data Engineering(ICDE),San Diego,CA,2017,pp.1553-1558.

[7]Martin gebser,Roland kaminski,Benjamin kaufmann,et al.Clingo=Asp+Control:Preliminary Report[J].Computer Science,vol.abs/1405.3694,2014.

[8]Martin Hirzel,Guillaume Baudart,Angela Bonifati,et al.,2018.StreamProcessing Languages in the Big Data Era.SIGMOD Rec.47,2(December 2018),29–40.

[9]Beck,Harald,Eiter,Thomas,Folie,Christian.Ticker:A system forincremental ASP-based stream reasoning[J].Theory and Practice of LogicProgramming,2017,17(5-6):744-763.

[10]Beck H,Dao-Tran M,Eiter T,et al.LARS:A logic-based framework foranalyzing reasoning over streams[C]//Twenty-ninth Aaai Conference onArtificial Intelligence.AAAI Press,2015.

[11]X.Ren,O.Curé,H.Naacke and G.Xiao,BigSR:real-time expressive RDFstream reasoning on modern Big Data platforms,2018IEEE InternationalConference on Big Data(Big Data),Seattle,WA,USA,2018,pp.811-820.

[12]R.Gu,S.Wang,F.Wang,C.Yuan,and Y.Huang,“Cichlid:Efficient largescale RDFS/OWL reasoning with spark,”in 2015IEEE International Parallel andDistributed Processing Symposium,IPDPS 2015,India,2015,pp.700–709.

[13]Li J,Wang J,Lin J.EMSR:An Efficient Method of Streaming Reasoning[C]//2018International Conference on Cloud Computing,Big Data and Blockchain(ICCBB).IEEE,2018:1-8.

发明内容

针对现有的看护系统及实时知识处理的不足之处和改进需求,本发明的目的是利用物联网传感器得到多维实时数据并进行语义化,然后利用语义数据流引擎进行高效实时知识查询和推理,进而实现高性能、个性化的智能居家养老看护系统。

本发明提供一种基于实时知识处理的居家养老智能看护系统,其特征在于:包括数据采集层,算法与知识服务层以及用户接口层,数据采集层通过物联网传感器得到多维实时数据并进行语义化,所述物联网传感器包括温湿度、烟雾、距离及酸碱度相应传感器,算法与知识服务层根据需求对实时数据利用知识标注组件将其转换为对应的三元组格式,利用语义数据流引擎进行高效实时知识查询和推理,所述实时知识查询和推理采用前后向链式相结合的知识推理方式实现,实现动态知识和静态知识相结合的实时知识推理,进行个性化、有针对性的复杂意外事件监测;用户接口层显示出推理结果,实现智能居家养老看护。

而且,执行过程包括以下步骤,

步骤1,根据需求在房间内部署相应的传感器;

步骤2,运行后台服务程序和传感器相关程序,准备执行看护监测,包括以下子步骤,

步骤2.1,运行后台程序,打开接收传感器数据的端口;

步骤2.2,运行传感器相关程序,传感器获取数据;

步骤2.3,将传感器得到的数据修改成所需要的输出模式;

步骤2.4,将转化后的结果由C/S模式传给后台程序;

步骤2.5,后台将接收到的结果转化为三元组格式;

步骤2.6,根据需要的结果生成查询语句;

步骤3,启动实时知识处理引擎,执行看护和检测查询及推理任务,包括以下子步骤,

步骤3.1,初始化传感器数据流;

步骤3.2,初始化语义数据流引擎;

步骤3.3,将数据流和查询注册进引擎;

步骤3.4,启动线程,执行查询,得到推理结果;动态查询与推理基于语义数据流引擎执行,支持配置前向、后向和前后结合3种推理模式;

步骤4,将查询结果显示在前端界面;

步骤5,查询结束时注销查询以及数据流,支持在前端界面取消传感器部署,随后查询语句和数据流都会被注销。

而且,进行动态查询与推理时,实时知识推理实现方式为,1)实现基于规则依赖的数据驱动的前向并行推理算法,并引入增量结果更新和多级索引来进行冗余消除和结果筛选;2)在1)的基础上提出基于查询特征索引的后向链式推理架构;3)在1)和2)的基础上实现融合前后向索引的分布式存储和查询优化。

与现有技术相比,本发明具有以下的优点:1)运用了语义数据流处理技术,实现了结合动态和静态知识的实时推理方法,可以支持比传统的简单数值判断方法更复杂、精确和个性化的事件监测,如在同样的空气环境感知数据条件下,基于个人健康档案(如哮喘患者)给出更精确的健康建议,或者根据个人身高信息,感知跌落事件发生的主体等;2)使用前后向结合的三元组分布式索引机制,实现数据与查询驱动相结合的知识推理方法,支持高性能的动态知识推理,比传统基于规则的知识推理方法效率更高。

本发明方案实施简单方便,实用性强,解决了相关技术存在的实用性低及实际应用不便的问题,能够提高用户体验,具有重要的市场价值。

附图说明

图1为本发明实施例的架构图;

图2为本发明实施例知识建模图;

图3为本发明实施例看护系统流程图;

图4为本发明实施例增量结果更新图;

图5为本发明实施例多级索引结果筛选图;

图6为本发明实施例后向链式推理架构图;

图7为本发明实施例查询处理过程图;

图8为本发明实施例索引边界示意图。

具体实施方式

以下结合附图和实施例具体说明本发明的技术方案。

本发明公开了一种基于实时知识处理的智能居家养老看护系统,其系统包括:数据采集层,算法与知识服务层以及用户接口层。数据采集层通过包括温湿度、烟雾、距离、酸碱度等物联网传感器获取实时数据,利用物联网网关采集传感器数据后实时发送给上一层;算法与知识服务层接收到数据后,利用知识标注组件将其转换为对应的三元组格式,并采用语义数据流推理引擎进行查询与推理,实时知识查询和推理部分采用前后向链式相结合的知识推理方法进行;用户接口层使用户根据需求部署传感器并可以将查询和推理结果显示出来。相对于传统物联网家庭监控方法,本系统利用知识图谱技术可以实现动态知识(如传感器测量信息)和静态知识(如家庭布局、个人健康史)相结合的实时知识推理,从而及时准确地进行个性化、有针对性的复杂意外事件监测,方便家属或监护机构在意外发生后第一时间得到反馈;此外,本发明的实时知识推理技术将数据与查询驱动的规则推理方式有机集合,通过分布式索引机制实现前后向结合的实时知识推理,提高实时知识处理系统的效率和伸缩性。

本发明实施例的实现主要包含智能居家养老看护系统和前后向链式实时知识推理方法2个部分。

(1)本发明实施例的智能居家养老看护系统采用如下技术方案:系统包括数据采集层,算法与知识服务层以及用户接口层。数据采集层通过物联网传感器可从智能网关接收实时数据,并对采集的实时数据进行格式处理,并将处理好的数据传给算法与知识服务层。这一层功能主要由几类传感器实现,包括温湿度传感器,红外线传感器,烟雾传感器,火焰传感器,雨滴传感器和PH传感器。算法与知识服务层首先将收到的数据转化为RDF三元组,并根据系统中注册的查询语句,调用实时知识处理引擎执行查询和推理,得出所需要的结果。用户接口层的作用则是将产生的查询结果输出显示出来。

(2)针对看护系统中的实时知识推理方面,本发明采用基于开源C-SPARQL引擎的扩展推理方案,在原引擎的基础上添加基于分布式索引的数据与查询驱动相结合知识推理模式。

1.首先,本发明实施例设置了一种基于语义数据流引擎的智能居家养老看护系统。其总体结构分为数据采集层、算法与知识服务层以及用户接口层3个模块,见图1。参见图3,基于该系统执行的主要流程如下:

步骤1:登录以及传感器部署;用户在使用时需要提前完成传感器的接线工作,将传感器部署到家中需要的位置。随后用户登录前端界面后,根据需求在房间内部署相应的传感器,只有经过部署后传感器的才会获得数据;

步骤2:启动后台服务流程和传感器平台数据采集流程,具体包括以下子步骤:

步骤2.1:运行后台服务流程,打开接收传感器数据的端口;

步骤2.2:运行传感器相关流程,传感器获取数据;此步骤中传感器的工作原理是其中敏感元件得到对应的物理量,转换元件将物理量转换为电信号,以此来获取数据。本发明实施例使用6类传感器实现相关事件监测功能,然后使用基于树莓派的传感器平台脚本将数值输出。参见图2,本发明实施例所包含的事件监测部分包含5个模块:

(1)温湿度监测模块:此模块使用温湿度传感器,传感器获取温湿度信息后经后台做简单的格式处理在前端输出,一段时间间隔后再进行下一次输出;

(2)火情监测模块:此模块使用火焰传感器,如果传感器检测到周围存在火焰,传感器自带的蜂鸣器响起,然后进行代码处理后传给后台,后台处理后在前端发出警告信息;

(3)烟雾监测模块:此模块使用烟雾传感器(例如PM2.5传感器),如果传感器检测到周围存在烟雾,传感器自带的蜂鸣器响起,然后进行代码处理后传给后台,后台处理后在前端发出警告信息;

(4)老人跌倒监测模块:此模块使用红外线传感器,红外线传感器不断计算传感器与障碍物之间的距离值后传给后台,后台将这些距离值存起来,并将最近的两次距离值做差以此来判断老人是否跌倒,并传一个警告到前端;

(5)老人意外排便模块:此模块使用PH传感器与水滴传感器,后台接受传感器传过来的PH值和是否有水滴来判断排便,PH若在一个范围内且床上感应到有水则传一个警告到前端;

具体实施时,可以根据需要在房屋的各个房间,例如厨房、卧室、次卧室、客厅、书房、厕所分别布置1种或多种设备。

步骤2.3:将传感器得到的数据修改成所需要的输出模式;此步骤在测得的传感器数值信息基础上添加传感器id和时间戳,并封装为JSON格式文档准备传输;

步骤2.4:将转化后的结果由网络传给后台流程;此步骤使用Python编写的WebSocket客户端将JSON对象发送给后台服务流程;

步骤2.5:后台将接收到的结果转化为三元组格式;此步骤使用Java编写的语义标注模块,按照语义传感器网络本体所构建的传感器知识图谱结构,将JSON形式的传感器数据标注为三元组集合,从而准备向语义数据流处理引擎提供三元组流,即RDF化。

步骤2.6:根据需要的结果生成查询语句;查询的目的在于得到需要的属性,为引擎推理做准备。因此查询语句根据监测场景需要而预先设置,在引擎启动后按需进行注册和执行,为用户的个性化看护服务做准备。

步骤3:启动实时知识处理引擎,执行看护和检测查询及推理任务,具体包括以下子步骤:

步骤3.1:支持用户通过前端界面通过拖拽传感器图谱至房屋平面图相应区域,部署传感器及相关查询;

步骤3.2:初始化传感器数据流;根据用户部署的传感器,启动相应传感器和语义标注线程;

步骤3.3:初始化CSPARQL引擎及实时推理组件;推理组件的工作模式由服务器配置文件在服务器启动时指定;

步骤3.4:将数据流和查询注册进CSPARQL引擎及其推理组件;

步骤3.5:启动结果监听线程,执行查询,得到查询及推理结果。

步骤4:将查询结果显示在前端界面;根据提前设置的输出格式在前端显示结果,效果更加直观。查询和推理结果的展示分为两类,对于常规的环境监测查询,如温湿度、PM2.5等传感器,定期将最新查询结果展示于通知栏,提供常规通知信息;对于意外事件监测如排便、跌倒等,则不定期的在事件被查询或推理得出异常结果时展示于警告栏;

步骤5:查询结束时注销查询以及数据流;当用户认为不需要查询时,可以在前端界面取消传感器部署,随后查询语句和数据流都会被注销。

2.其次,本发明实施例进一步提供了一种数据与查询驱动相结合的实时知识推理方案,本发明进一步提出的实现方式如下:

1)实现基于规则依赖的数据驱动的前向并行推理,并引入增量结果更新和多级索引来进行冗余消除和结果筛选;2)在1)的基础上提出基于查询特征索引的后向链式推理架构;3)在1)和2)的基础上实现融合前后向索引的分布式存储和查询优化。实施例的具体实施步骤如下:

步骤1:基于规则依赖分析和多级索引的数据驱动并行流推理;对于数据驱动的前向链式实时推理,本发明在SPARK平台上实现支持RDFS及以上语义的并行推理流程,并引入增量结果更新和多级索引来进行冗余消除和结果筛选。

实施例中,此步骤包含以下子步骤:

步骤1.1:基于规则依赖分析的数据驱动前向并行流推理

知识图谱前向推理过程是根据输入数据,迭代应用语义框架中的每个规则生成新三元组,直到没有新的三元组生成的过程。由于一个规则的输出数据可能是另一个规则的输入数据,因此规则之间存在规则依赖性,对应的,滑动窗口之间部分相同数据也可能产生不同的推理结果。如果规则执行顺序安排不当,则规则依赖性可能会导致重复执行规则,或者导致整个推理过程而产生循环开销,因此,需要考虑如何优化规则执行顺序,以消除推理规则的重复执行。

例如根据RDFS的14条推理规则(https://www.w3.org/TR/2003/WD-rdf-mt-20030123/),可以发现推理规则之间主要有以下三个类别:1)实体之间的关系(T1),包括规则R9、R11;2)属性之间的关系(T2),包括规则R5;以及3)实体与属性之间的关系(T3),包括规则R2、R3、R7。根据上述分类,可以使用如表2的流程进行RDFS并行推理。类似机制可扩展用于OWL规则(https://www.w3.org/TR/2003/WD-rdf-mt-20030123/mantic-web/owl-dl-semantics.html)进行并行推理,并部署于Spark等分布式流平台。

表2:RDFS并行推理流程

步骤1.2:基于时序和位置信息的索引机制

传统的流查询中每次触发查询,都会对窗口中的所有数据重新匹配一次,这样会造成大量冗余。本发明拟通过对每个三元组进入系统的时间和窗口时长的记录来追踪输入数据的有效期,以及由输入数据产生的查询和推理结果有效期,并在窗口滑动时动态维护结果以删除过期结果(如图4中举例:图4上部分展示四元组r1-r11在时间轴T上的时序排列,其中每个四元组内容为主谓宾+时刻,如r1=,w1-w4为时间轴上的4个窗口位置,每个窗口的长度为4(即w1的包含t1-t4时刻的四元组r1-r4),窗口滑动步长为2;图4下半部分体现并行推理机增量推理过程,即在输入时,每次添加窗口滑动后的更新部分,如:w1更新部分为r1-r4,即w1-w0=r1-r4,而在输出时,每次由窗口滑动出发增量结果更新,即在t2时刻输出结果z0,在t4时按照补充增量结果z1,并根据z0时间戳对其进行保留)。

为了快速从推理结果中找到符合查询条件的三元组,本发明提出基于三元组主谓宾位置的索引和查询中变量位置的索引并进行两级过滤机制来筛选符合要求的结果,如图5中举例。图5展示了多级索引的两个模块的筛选原理,常量索引是根据已知查询条件tp给出的定值,如type、student和teacherOf等,只有满足该条件的才可以被筛选;变量索引是根据多个tp中的相同变量的交集得到的,例如tp1和tp3中的x变量,变量索引公式和多级索引算法如下。

变量索引的第一步是取出查询语句中相同变量的tp集合

取出了具有相同变量的tp的集合后,将满足条件的tp集合进行联接得到满足所有查询条件的元素x。

S

然后,从

最后将所有查询语句中的变量例如x,y等的集合进行合并,得到输出结果集S

多级索引的算法如表3所示。

表3多级索引算法设计

步骤2:基于查询特征索引的查询驱动后向并行流推理

图6展示本发明在前向推理索引基础上提出基于数据和查询特征索引的后向链式推理架构,共有三个核心模块,首先是加载新的RDF数据集并将内容提取为主谓宾格式(s,p,o),然后将主谓宾分别存入标识符-字符串映射表(ID-String),为每个主谓宾赋予一个独特的数字ID标识,用于提高元素的检索效率,随后提取三元组特征集(CS)索引和扩展特征集(ECS)索引,其次是基于ECS索引的后向推理,最后是处理SPARQL查询,生成分布式查询计划并获取结果。

步骤2.1:基于扩展特征集索引的后向链式推理

本发明拟采用扩展特征集(ECS)索引来加速后向链式推理。ECS索引建立在特征集(CS)索引之上。CS索引通过对主语的属性位图进行标记来确定,用于记录每个主语的属性特征。在其基础上,ECS索引记录三元组之间主语和宾语的可连接(Join)性,即记录主语和宾语相同的三元组集合所涉及到的CS索引。本发明后向链式推理的过程和传统算法类似,即通过递归的触发可执行规则重写和扩展查询,并寻找符合条件的三元组。在此过程中,由于建立了ECS索引,可以加快匹配的速度。

步骤2.2:分布式查询计划生成

在完成查询改写后,通过解析并提取查询ECS图、匹配三元组ECS以及生成并执行分布式查询计划来得到最终查询和推理结果。查询解析过程如图7所示:首先将查询语句表示成BGP,如图中的4个节点x,y,z,w表示查询语句中的未知参数,student和teacher表示已知的节点参数,节点与节点之间的边表示已知属性。通过BGP中的相连的未知节点和已知参数,转换成对应的CS索引图,在转换过程中,每个节点是由多个推理得到的实体合并而成,如图中的Sx,Sy和Sz表示对未知节点的CS索引。通过查询语句中的谓语需求和属性位图,将需要查询CS索引和CS索引表联立起来。转换成CS图后,将相连的两个CS和有向边转换成一个ECS,例如Sx和Sy转换成Qxy;将CS中所有的节点转换成ECS后,相邻的ECS节点之间通过相同的CS索引进行联接操作,例如Qxy和Qxz之间,通过相同的Sx进行联接。根据ECS索引结构是由主语和宾语组成的,因此联接一般有以下几种情况,ss,so,os,oo,表示起始节点的主语或宾语和终止节点的主语和宾语相联接,例如os表示起始节点的宾语和终止节点的主语进行联接。

查询计划为匹配ECS链相对应的三元组的各个集合决定联接执行顺序,查询计划根据查询链有两种排序策略,第一种是根据不同查询链之间的公共属性,尽早滤除无关三元组,称为外部排序;第二种是根据特定查询链减少ECS之间的宾语和主语联接的中间结果,这些中间结果对最终结果没有无关,称为内部排序。首先为了获取整个查询链的外部排序,需要根据链中的每一个项的执行成本进行计算,让整个查询链的成本最小。为了获得内部排序,考虑到链中的所有ECS都通过宾语和主语联接链的,可以向左或向右一次扩展一个ECS的现有节点或子链。基于此,本发明拟采用一种简单的试探法,该试探法从成本最低的ECS开始,并从左或右选择成本最小的ECS来扩展链。

通过外部排序和内部排序可以很明确的找到一条成本最小的执行计划。通过查询ECS索引并加入匹配链的每个ECS的三元组,可以分布式部属和执行每个查询链。此过程中,需要在分布式数据存储的基础上考虑到分布式查询部属的负载均衡和通信开销问题,从而得到整体上的多查询优化部属方案。

步骤3:融合前后向索引的分布式存储和查询优化

在并行前向推理中,本发明从三元组自身特性出发,使用了基于主谓宾签名的索引机制,快速定位具有相似元素的三元组。在后向链式推理中,本发明从三元组关联特性出发,建立ECS索引,快速定位查询中的联结(join)操作所需要的三元组集合。在依照这两类索引进行分布式存储时,通常希望一个索引项所指向的三元组集合能被存储在同一个节点上,以最小化通信和调度开销。然而,两种索引机制的不同出发点导致在进行分布式存储时可能存在物理存储节点划分冲突的问题。比如,前向索引项由于建立在三元组自身主谓宾位置上,更倾向于指向多簇“星状”三元组集合,而后向索引项由于建立在三元组头尾相连的关联特征上,更倾向于指向多条“链状”三元组集合。这样,可能存在一些三元组集合在指向某类索引的某项时,指向另一类索引的多项,造成存储节点的“边界断裂”现象(如图8所示:深色虚线框表示基于数据位置的前向索引项,如前向索引ID_1等,在分布式存储时倾向于将若干星型拓扑三元组共同存储;浅色虚线框表示基于查询模式的后向索引项,如后向索引ID_1等,在分布式存储时倾向于将由查询中的join联结操作构成的若干链状拓扑的三元组共同存储;而以上2种分布式存储方式的倾向不同可能导致节点存储方案不一致问题)。而这种现象可能导致涉及到断裂数据的分布式查询性能下降。

解决“边界断裂”的简单方法是进行副本传递。但这种方法会造成额外存储开销,也会大幅降低总体索引效率。本发明采用联结选择度预估的方法判定边界归属。对于频繁出现的星状三元组模式,使用贝叶斯网络来表示多属性取值联合概率分布,从而估算该属性列表对应的星状三元组模式的选择度。对于频繁出现的链状三元组模式,实施例提出简单使用组成该链的各三元组模式的选择度乘积来估算。这样,可以根据指向边界的多个前向、后向查询分别计算其选择度,并分类统计其值,然后判断该边界对于哪类查询的作用更大,从而决定边界归属。在此过程中,本发明综合考虑了前/后向推理的性能,使得在最小化存储开销的前提下,最大化的同时支持前向和后向的多查询优化。

具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号