首页> 中文学位 >基于Web数字图书馆的信息检索及其优化的研究
【6h】

基于Web数字图书馆的信息检索及其优化的研究

代理获取

目录

文摘

英文文摘

独创性声明及学位论文版权使用授权书

第一章总论

第一节信息检索概述

1.1信息检索技术的推动力

1.2信息检索与数据库查询的比较

1.3信息检索处于时代的前沿

第二节信息检索的流程

2.1用户的交互

2.2文档的表示与处理

2.3信息检索过程

第三节信息检索研究的现状

3.1检索模型

3.2数字图书馆的研究现状

第四节本文的研究背景和主要内容

4.1本文研究工作的背景

4.2本文拟研究内容

第二章信息检索领域中查询扩展优化问题的研究

第一节查询扩展产生的背景及概述

第二节查询扩展的研究回顾

2.1全局自动查询扩展

2.2局部分析和用户反馈查询扩展方法

第三节当前查询扩展研究的代表——LCA方法

第四节本章小结

第三章数字图书馆和结构化文档的研究

第一节数字图书馆的研究现状

1.1数字图书馆的定义

1.2数字图书馆的结构的研究概况

第二节数字图书馆中的文档模型

2.1结构化文档

2.2多媒体文档

2.3多语言文档

2.4分布式文档集与联合检索

第三节结构化文档的索引和检索的研究

3.1结构化文档的检索模型

3.2标记型语言

第四节本章小结

第四章基于用户日志的查询扩展概率模型

第一节课题背景

1.1 Web时代信息检索面临的问题

1.2该问题的解决思路

第二节基于用户查询日志的查询扩展概率模型

2.1基本思想

2.2模型描述

第三节实验方法

3.1实验数据与方法

3.2评估标准

3.3对比算法

第四节实验结果及讨论

4.1实验一:扩展用词的质量分析

4.2实验二:查询效果比较

4.3实验三:词组对查询精度的影响

4.4实验四:扩展用词的数量对查询精度的影响

第五节本章小结

5.1基于用户日志的查询扩展方法的研究总结

5.2用户日志挖掘的研究展望

第五章结构化文档的层次索引模型和自适应检索

第一节研究课题背景

1.1引言

1.2问题描述

1.3相关工作

1.4该问题的解决方案

第二节结构化文档的层次化索引

2.1文档结构

2.2各节点的关键词权重计算

2.3索引关键词的向上广播和裁剪算法

第三节结构化文档的自适应检索和浏览设计

3.1路径相关度计算方法

3.2自适应检索算法

3.3结构化文档的自适应检索系统

第四节实验及结果讨论

4.1实验数据与方法

4.2文档结构化信息对文档检索的影响的实验

4.3自适应检索的性能评估

4.4阈值设置实验

第五节本章小结

5.1本章工作回顾

5.2结构化文档检索的应用和展望

第六章总结与展望

第一节本文研究总结

第二节今后研究展望

参考文献

发表论文和参加科研情况说明

致 谢

展开▼

摘要

我们研究工作的主要目的是为提高数字图书馆中检索系统的文档查询精度并实现细粒度检索.首先,我们提出了基于用户日志的查询扩展概率模型,以提高文档的整体检索精度.自动查询扩展是解决用户查询信息不足问题的有效方案.基于对大量用户查询日志的统计分析,我们提出了一种全新构建于对用户日志的挖掘之上的查询扩展概率模型.该模型利用贝叶斯方法建立用户查询用词与文档用词之间的统计概率关系,并利用这些关系选择和评价高质量的扩展用词.其次,我们的工作主要围绕结构化文档的细粒度检索展开.我们提出了针对结构化文档的层次化索引向上广播和裁剪机制,以及在该层次化模型之上的自适应检索模型,以实现对结构化文档中任意粒度的文档元素的查询.在该结构化索引的基础上,我们实现了结构化文档的自适应检索的原型系统.通过该系统,用户可以直接定位到与其查询相匹配的文档部分.同样,我们进行了一系列实验检验该索引模型和检索算法的有效性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号