首页> 中文学位 >基于概念语义相似度的文本信息检索研究
【6h】

基于概念语义相似度的文本信息检索研究

代理获取

目录

封面

声明

中文摘要

英文摘要

第一章绪论

1.1选题的背景和意义

1.2国内外研究现状

1.3本文所做工作

第二章信息检索技术概述

2.1信息检索的概念及类型

2.1.1信息检索的概念

2.1.2信息检索的类型

2.2信息检索系统

2.3全文信息检索Lucene综述

2.3.1Lucene的历史

2.3.2Lucene原理

2.4检索效果评价

第三章语义Web及本体技术

3.1语义Web概述

3.2本体概述

3.2.1本体的定义

3.2.2本体的分类

3.2.3本体的描述语言

3.2.4本体的构建工具

3.2.5创建一个本体

3.3本章小结

第四章概念语义相似度计算方法研究

4.1概念语义相似度

4.2基于数据层(DataLayer)的语义相似度计算

4.3基于本体层(OntologyLayer)的语义相似度计算

4.3.1基于实例的相似度计算模型

4.3.2基于属性的相似度计算模型

4.3.3基于语义距离的相似度计算模型

4.4基于上下文层(ContextLayer)的语义相似度计算

4.5综合语义相似度计算及实验分析

4.5.1综合相似度计算

4.5.2实验分析

4.6本章小结

第五章文本信息检索研究

5.1系统的设计方法描述

5.2查询扩展机制

5.2.1传统的查询扩展

5.2.2基于本体的查询扩展

5.3排序过滤机制

5.3.1Lucene中文档分值计算

5.3.2改进的文档分值计算

5.3.3排序过滤

5.4实验分析

5.5本章小结

第六章结束语

参考文献

致谢

攻读硕士期间发表论文

展开▼

摘要

伴随着网络信息的剧增,人们越来越依赖于信息检索技术来寻找信息,但目前基于关键字的传统搜索方法并不能很好地满足人们的信息需求。由于忽视了资源本身所含的语义信息,传统的基于关键字的信息检索,只能获得较低的查全率和查准率。本体理论和技术源于知识工程和人工智能领域,能够很好的处理基于语义的推理机制和自然语言理解问题,因而成为改进传统信息检索方式的良好途径。相比于传统的基于关键字检索方法,基于本体技术的语义信息检索能减少不相关的返回结果,提高检索结果的查全率和查准率,更加符合用户的需求。
  本文的主要工作由两个部分组成:
  (1)对概念语义相似度计算方法进行分析和研究的基础上,本文提出了一种综合的语义相似度计算方法。在相似度计算时充分考虑数据层(Data Layer)、本体层(Ontology Layer)和上下文层(Context Layer),并对本体层的语义相似度计算进行了细化,重点对基于语义距离的相似度计算方法进行了改进。实验验证上述方法的有效性。
  (2)提出了一种文本信息检索方法,把本体技术结合到传统的全文信息检索中。对初始查询进行查询扩展,利用概念语义相似度,对扩展词的规模和查询权重进行有效的控制,并结合向量空间模型(Vector Space Model,VSM)和本体技术对检索结果文档的分值进行计算,过滤与原始查询语义相关度较小的文档,最后实验验证该方法的效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号