首页> 中文学位 >基于双层语义分析的文档排序方法研究
【6h】

基于双层语义分析的文档排序方法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 查询词概念扩展

1.2.2 复述

1.2.3 主题模型

1.3 本文的主要工作

1.4 本文结构安排

第二章 相关理论和技术

2.1 信息检索

2.1.1 信息检索的过程

2.1.2 信息检索模型

2.2 语义分析方法

2.2.1 词和概念层次的语义分析

2.2.2 句子层次的语义分析

2.2.3 篇章层次的语义分析

2.3 本章小结

第三章 基于双层语义分析的文档排序方法

3.1 问题引出

3.2 基于双层语义分析的全文检索系统框架

3.2.1 系统框架介绍

3.2.2 查询语句预处理过程

3.2.3 查询语句的复述过程

3.2.4 基于LDA模型的篇章层次语义处理过程

3.3 方法描述

3.3.1 基于双层语义分析的文档打分公式

3.3.2 算法描述

3.4 实验分析

3.4.1 测评标准

3.4.2 实验结果与分析

3.5 本章小结

第四章 检索系统的实现

4.1 系统目标

4.2 系统整体设计与模块介绍

4.2.1 系统的整体设计

4.2.2 系统中模块介绍

4.3 系统中的模块实现

4.3.1 查询语句层次语义处理模块

4.3.2 篇章层次语义处理模块

4.3.3 检索模块

4.3.4 其他模块

4.4 本章小结

第五章 总结与展望

5.1 总结

5.2 展望

参考文献

在校期间的科研成果与参加的科研项目

致谢

展开▼

摘要

互联网的蓬勃发展带动了信息检索技术的不断成熟,搜索引擎已经成为每个人都离不开的重要工具,人性化服务的时代背景也要求信息检索技术向智能化发展。传统的基于关键词机械匹配的信息检索方式已经不能满足科学研究和普通用户的需求,因此基于语义的信息检索成为当前信息检索研究的热点,通过自然语言语句进行信息检索已经成为发展的趋势。
  面对自然语言查询语句,目前的检索系统往往不能够精确的理解用户的查询请求;同时,在检索的过程中,现有的技术往往将文档中的语义信息丢弃。在对现有的信息检索模型的分析研究下,我们发现单纯的查询语句处理和主题模型检索并不能满足用户对检索结果准确率越来越高的要求。
  分析现有的技术和研究成果,本文提出了一种基于双层语义分析的文档排序方法,分别通过查询语句层次语义分析和文档篇章层次语义分析,获取信息检索过程中所需的语义信息,从而提升搜索引擎性能。同时给出了基于双层语义分析的全文检索系统框架,该系统能够在查询语句层次上,对查询语句进行语义处理和复述;在文档篇章层次上,通过提取文档中的潜在主题语义信息,用于优化检索结果。该方法通过结合查询语句层次的语义信息和篇章层次语义信息,在向量空间模型的基础上给出了基于双层语义分析的文档打分公式。
  根据提出的基于双层语义分析的全文检索系统框架,设计并实现了原型系统,并解决在系统实现的中的问题。通过对系统的实验结果进行分析,验证了这种基于双层语义分析的全文检索方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号