声明
致谢
摘要
1 绪论
1.1 研究背景
1.2 搜索引擎的研究现状
1.3 搜索引擎的问题定义
1.4 研究内容和目标
1.5 论文的难点和关键任务
1.6 论文的组织结构
2 元搜索技术综述
2.1 元搜索系统结构
2.2 成员搜索引擎调度策略
2.3 查询转换和页面采集技术
2.4 元搜索引擎消重技术
2.5 元搜索结果排序
2.5.1 元搜索结果排序算法
2.5.2 HITS算法
2.6 网络爬虫
2.6 本章小结
3 元搜索技术问题分析和优化方案设计
3.1 元搜索系统结构的优化和改进
3.1.1 基于搜索优化的元搜索存储问题识别
3.1.2 基于倒排索引的方案优选
3.2 查询转换和页面分析
3.2.1 元搜索引擎查询转换和页面分析
3.2.2 定向采集站点查询转换和页面分析
3.3 元搜索网页消重算法的优选
3.4 元搜索结果排序算法的改进
3.4.1 HITS算法的“主题漂移’’问题
3.4.2 元搜索结果排序算法改进的基本思路
3.4.3 改进后的元搜索结果排序算法逻辑设计
3.4.4 HITS算法改进方案设计
3.5 本章小结
4 基于元搜索的舆情信息采集系统的设计与实现
4.1 概要设计
4.1.1 系统架构
4.1.2 系统概念模型
4.1.3 代码框架设计
4.2 详细设计和实现
4.2.1 成员搜索引擎调度模块
4.2.2 查询转换和页面采集模块
4.2.3 消重模块
4.2.4 排序模块
4.2.5 系统数据库设计
4.3 本章小结
5 系统性能分析和测试
5.1 元搜索查全率统计分析
5.2 排序结果比较
5.2.1 直观数据
5.2.2 PV和CTR统计分析
5.3 本章小结
6 结论
6.1 工作总结
6.2 工作不足和展望
参考文献
附录
索引
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集