首页> 中文学位 >基于本体的XML近似查询方法研究
【6h】

基于本体的XML近似查询方法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题背景

1.2 课题意义

1.3 研究现状

1.3.1 XML的近似查询处理

1.3.2 基于本体的查询松弛

1.4 本文研究工作

1.5 本文组织结构

第2章 基础知识

2.1 XML相关技术

2.1.1 XML文档结构

2.1.2 XQuery查询语言

2.1.3 XML近似查询技术

2.2 XML文档中的语义信息

2.2.1 XML文档中的语义信息

2.2.2 XML信息抽取和本体的映射规则

2.3 本体相关技术

2.3.1 本体的定义

2.3.2 本体的分类及关系

2.3.3 本体的构建方法

2.3.4 本体映射的基本方法

2.3.5 基于语义度量的本体映射

第3章 基于本体的查询预处理

3.1 本体构建

3.1.1 系统框架

3.1.2 方法描述

3.2 本体相似度和本体语义树

3.2.1 本体的相似度计算

3.3.2 本体语义树的建立

3.3 基于本体的语义扩展

3.3.1 冲突检测规则

3.3.2 语义扩展规则

3.3.3 基于本体的语义松弛算法

3.4 本章小结

第4章 基于本体的XML近似查询

4.1 查询的结构扩展

4.1.1 结构松弛的原理

4.1.2 结构相似度的计算方法

4.2 基于本体的查询条件扩展

4.2.1 基于语义距离的本体条件扩展原理

4.2.2 查询条件松弛算法

4.3 基于本体的近似查询算法

4.4 本章小结

第5章 设计与测试

5.1 系统结构

5.1.1 本体导入解析

5.1.2 XML文档解析

5.1.3 领域本体语义标注XML元数据

5.1.4 XML信息抽取和本体映射

5.2 实验测试

5.2.1 测试平台及实验数据

5.2.2 测试查询及测试参数介绍

5.2.3 基于本体的查询松弛整合算法测试

5.3 本章小结

第6章 总结与展望

6.1 工作总结

6.2 工作展望

参考文献

致谢

展开▼

摘要

随着XML文档蕴含信息量的逐渐增加,基于大量异构XML文档的查询系统很难提供给用户最为相关的查询结果,从而导致查询结果的查准率和查全率都不能令人满意,可能会出现极端的情况:将不符合用户查询意图的数据包含到查询结果集合中,导致查询结果过多,有效信息湮没其中;没有检索到应该纳入符合要求的数据,查询结果信息过少;错误理解了用户查询的侧重点,结果与用户预期有较大偏差,导致查询无效。出现“空结果”问题的原因主要分为以下几个方面:查询路径和XML文档内部数据的组织结构的不匹配;查询路径中节点元素的命名和XML文档中节点的命名规则的不同;查询条件过紧,从而导致满足条件的数据过少;由于用户对XML文档领域知识没有共同的理解,导致符合用户查询倾向的信息无法反馈给用户。
  解决空结果的方法很多,引入领域本体知识是其中之一。为了解决因对语义扩展到因素考虑不足而产生空结果的问题,引入领域本体知识来表示语义,利用本体聚类和本体映射的方法,实现查询的扩展。要实现明确的语义,需要两类语义数据的支持:描述一个专业领域知识,提供共享词汇支持的本体;包含明确语义信息的文档实例,即本体描述的本体实例。从XML文档中抽取隐含语义信息,构建描述XML文档的形式化语义描述的本体,即可以将XML描述的信息从语法层提升到语义层。
  基于上述需求,本文提出基于本体的XML近似查询。整个方法主要分成三部分:首先,通过对XML的解析,将文档中的元素、属性以及值等分离出来,提取各种概念以及概念之间的关系,映射为本体的概念、属性和关系,构建标准的领域本体中,全面的体现XML文档中的语义信息。其次,针对不同方法所构建多个异构的冲突的本体,通过基于相似度计算的本体映射,进行查询条件的语义扩展;然后对XML查询的结构和条件进行扩展,在条件松弛处理的过程中,首先将条件拆分成多个元素,依重要程度选取用于松弛的元素,到本体中进行基于语义相似度的查询松弛,最后基于相关度来选取松弛后的结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号