首页> 中文学位 >基于概念图的信息检索查询扩展模型研究与实现
【6h】

基于概念图的信息检索查询扩展模型研究与实现

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1 研究背景

1.1.1信息检索研究现状

1.1.2 自然语言理解与语义搜索

1.2查询扩展的研究背景

1.3本文的组织和结构

第二章知识的表示

2.1语言模型

2.2概念图的知识表示

2.2.1概念图的定义

2.2.2概念图的组成

2.2.3概念图匹配的基础

2.2.4概念图的推理基础

2.3本章小结

第三章查询扩展

3.1 引言

3.2本文的语义分析工具

3.2.1《知网》的结构和特点

3.2.2知网的描述语言

3.3本文的词语的相似度计算方法

3.3.1基于知网的义原相似度的计算

3.3.2基于知网的词语语义相似度的计算

3.4本文的查询扩展算法

3.4.1基于《知网》的查询扩展方法

3.4.2词项权重的计算

3.4.3本文的词项扩展及权重

3.4.4文档相似度

3.4.5本文的查询扩展模型

3.5本章小结

第四章概念图相似度计算

4.1 引言

4.2语义匹配的研究

4.3概念图的运算

4.4本文的语法图到语义图的转化方法

4.4.1 为什么要研究语法图到语义图的转化

4.4.2语法图到语义图的转化的方法

4.5本文的概念图的语义相似度

4.5.1概念结点的相似度

4.5.2关系结点的相似度

4.5.3概念图的相似度

4.6句法结构处理

4.7概念图相似度计算模型与仿真实验

4.8本章小结

第五章系统的实现

5.1 系统设计

5.1.1系统开发工具

5.1.2系统框架

5.1.3系统界面设计

5.2系统主要功能模块

5.2.1预处理模块

5.2.2建立索引模块

5.2.3查询扩展模块

5.2.4检索模块

5.2.5语义检索模块

5.3系统的评测

5.4结果分析

5.5 小结

总结和展望

1.总结

2.进一步的工作与展望

参考文献

攻读硕士学位期间发表的论文

致谢

展开▼

摘要

目前基于语义的信息检索系统虽然能够识别一定的语义信息,但是由于它们对语言缺乏分析和理解,对查询式和资源表达式仅仅是一种离散的分析,失去了词语之间内在的联系,这就造成信息检索精确率下降。为了提高信息检索的精确率和查全率,本文利用自然语言处理中的概念图理论和《知网HowNet》语义词典,在lumer v4.8实验系统之上,提出并实现了一个具有语义检索功能的信息检索查询扩展模型系统。 以下是本文的主要研究内容: (1)查询扩展算法。目前信息检索的查询扩展都是基于统计的模型,本文将统计模型和《知网HowNet》结合,通过《知网HowNet》对词项重新加权,利用N层向量空间模型得到新的文档与查询的相似度,以改善系统检索的效果。 (2)概念图的生成。概念图的生成,即如何把语义在语言学上形式化,这是计算机语义理解的第一步,是一切语义理解技术的基础。所谓语言学上的形式化,就是把需要研究的问题以一定的数学形式,严密且规范地表示出来。本文选用概念图作为知识表示的工具,利用哈工大的IR—Lab系统标注的句法依存关系,根据汉语的语法特征,对语法到语义的关系进行转化,生成概念图,并实现概念图的匹配。 (3)设计并实现了基于概念图的信息检索查询扩展模型系统。该系统主要包括查询扩展模块概念图的匹配模块。其中,查询扩展模块保证同一概念不同表达的词语能被检索出来;概念图匹配模块是意义相同或非常相近的词语或句子是否能够被检索出来的关键因素。本文通过采用查询扩展技术,检索出相关的文档,提高信息检索的查全率;通过概念图理论的投影匹配、最大连接匹配及概念图相似度运算,检索出相匹配的文档,提高了信息检索的精确率。 最后,给出了本系统的评测结果。针对本文的查询扩展技术、概念图生成阶段和概念图匹配阶段采用的方法,对系统进行了测试及分析,通过与目前的基于统计的模型的比较,实验结果表明本文所采用的方法,提高了信息检索系统的查全率和精确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号