首页> 中文学位 >基于Web的个性化信息检索技术研究
【6h】

基于Web的个性化信息检索技术研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景

1.1.1 Web检索发展动向

1.1.2信息检索工具分类

1.1.3个性化服务系统

1.2搜素引擎

1.2.1搜索引擎的工作原理

1.2.2搜索引擎的分类

1.2.3搜索引擎技术的研究现状

1.2.4发展趋势

1.2.5搜索引擎的评价

1.3搜索引擎中的检索排序技术

1.3.1基于链接的相关度排序

1.3.2基于概念的信息检索

1.3.3基于相关度的反馈

1.3.4基于聚类的检索

1.4搜索引擎存在的问题

1.5研究内容和结构

第二章元搜索引擎技术研究

2.1元搜索引擎的基本原理

2.1.1搜索代理

2.1.2运算代理

2.1.3查询代理

2.2元搜索引擎的分类

2.2.1多线索式元搜索引擎

2.2.2 All-in-One元搜索引擎

2.2.3桌面元搜索引擎

2.3元搜索引擎的优越性

2.4元搜索引擎的不足

2.5本章小结

第三章个性化搜索引擎模型设计

3.1个性化搜索引擎流程分析

3.2系统体系结构图设计

3.3个性化搜索引擎定义及分析

3.4基于用户行为特征的统计分析

3.4.1用户查询日志文件

3.4.2用户行为特征分析

3.5用户兴趣模型的生成

3.5.1用户兴趣关键词的提取方法

3.5.2信息源

3.5.3信息处理

3.6成员搜索引擎的选择

3.6.1定性算法

3.6.2定量算法

3.6.3基于学习的算法

3.6.4本系统成员搜索引擎的选择

3.6.5各中文搜索引擎的实验比较

3.7元搜索引擎数据源的网页提取

3.8搜索结果的排序处理

3.9本章小结

第四章个性化搜索引擎关键技术研究与改进

4.1信息搜集的改进

4.2元搜索引擎结果的排序处理

4.2.1元搜索引擎结果的集成

4.2.2基于模糊积分的排序算法

4.3信息处理的优化

4.3.1去噪消重算法的改进

4.3.2算法评测

4.3.3中文分词的优化

4.4本章小结

第五章部分功能的实现说明

5.1搜索结果采集的实现

5.1.1 Google下的搜索结果采集

5.1.2 Baidu的搜索结果采集

5.2搜索结果的再处理

5.2.1搜索结果的保存

5.2.2实现信息的二次搜索

5.3本章小结

总结与展望

本文工作总结

未来的工作

参考文献

致谢

展开▼

摘要

随着计算机技术的发展,Internet应用需求也日益扩大,各种基于Web的软件技术也得到了长足的进步。为了能够给用户提供及时、准确的信息服务,搜索引擎技术应运而生,搜索引擎作为网络信息服务最基本的手段,在一定程度上可以满足用户对WWW上信息检索的要求,但由于其通用的性质,这些通用的搜索引擎所表现的数据信息覆盖领域广、信息量大、数据不稳定、冗余度大等特性,导致用户查询的精度非常低,其效果难以满足不同背景、不同目的和不同时期的用户查询请求。 元搜索引擎正是满足这种需求的产物,元搜索引擎技术是一种集成搜索引擎技术,它主要通过成员搜索引擎选择、文本选择、结果集成三个主要步骤来完成信息检索任务,如果系统策略设计得当,成员搜索引擎选择方法合适,那么相对于独立的传统搜索引擎来说,元搜索引擎一般可以达到更高的搜索覆盖率和更好的查询效果。但是元搜索引擎也会面临与传统搜索引擎一样的问题,就是不能对用户进行个性化分析和提供相应的有针对性的服务,而且如果系统的集成策略设计地过于简单和机械化,则元搜索引擎多数情况下并不会取得更好的信息检索效果。 本文针对现有元搜索引擎的局限性和当前用户的个性化需求,以用户兴趣模型为基础,提出了实现用户个性化搜索的模型,并研究其相关技术与算法。主要的研究工作包括:①提出元搜索引擎的设计思路,主要介绍元搜索引擎的总体设计模型以及各主要部分的功能,包括查询代理、搜索代理、运算代理三大功能模块。②分析了搜索引擎的查准率不高等性能问题,对个性化技术的本质作了定义和分析,并指出了实现个性化技术的一般步骤和方法。③通过对用户行为特征的统计分析发现,用户的查询

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号