首页> 中文学位 >基于查询与内容的文档表示模型研究
【6h】

基于查询与内容的文档表示模型研究

代理获取

目录

封面

声明

目录

中文摘要

英文摘要

插图索引

附表索引

第一章 绪论

1.1 课题背景与意义

1.2 现代信息检索概述

1.3 本文的主要工作

1.4 本文的组织结构

第二章 信息检索模型

2.1 信息检索模型

2.2 检索模型的性能评测

2.3 本章小结

第三章 用户反馈在信息检索中的应用

3.1 全信息理论简介

3.2 用户反馈在信息检索中的应用

3.3 基于查询集的文档组织方法

3.4 本章小结

第四章 基于查询与内容的文档表示模型

4.1基于查询与内容的文档表示模型

4.2 实验设计

4.3 实验结果分析

4.4 基于共现查询与共现内容的文档表示模型

4.5 本章小结

第五章 原型系统设计与开发

5.1 Lucene简介

5.2 原型系统设计与开发

第六章 总结与展望

6.1 全文总结

6.2 展望

参考文献

硕士期间发表的论文和参与的项目

致谢

展开▼

摘要

随着Internet技术的飞速发展,互联网上的信息呈指数级增长。庞大的数字化信息与人们获取所需信息的能力之间的矛盾日益突出,怎样快速准确地检索相关信息已经成为当今信息领域的研究热点。在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一。根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体。当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈。
  本文首先对当前国内外经典检索模型及其文档表示方法进行了介绍,接着阐述了全信息理论及认识论信息,概述了语用信息在查询扩展、排序算法及文档表示中的应用现状,重点讨论了最具代表意义的―基于查询集的文档组织方法。针对该方法的不足进行改进,给出了―查询样本空间稳定性判定的概念,提出了一种整合用户查询与文档内容的文档表示模型,将用户隐性反馈的语用信息和文档自身的语义、语法信息相结合,动态地调整索引库。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号