文摘
英文文摘
第一章序言
1.1 WEB的发展
1.2 WEB搜索引擎的发展
1.3研究目标
1.3.1改进Web搜索引擎信息采集性能
1.3.2促进搜索引擎技术的研究和提高
1.4论文作者的工作
1.5论文结构
第二章WEB搜索引擎及其信息采集技术
2.1搜索引擎的分类
2.1.1按工作力式划分
2.1.2按检索内容划分
2.1.3其它的分类方法
2.2搜索引擎的系统结构
2.3 WEB搜索引擎的信息采集技术
2.3.1基本机制
2.3.2搜寻程序专用协议
2.3.3搜索程序设计中需要考虑的几个问题
第三章主要搜寻算法及其分析
3.1搜寻算法的衡量标准
3.2主要搜寻算法简介
3.2.1BackLink算法
3.2.2 PageRank算法
3.3主要搜寻算法在搜寻程序中的实现
3.4主要搜寻算法的比较
3.5页面下载效率
第四章集中式搜寻算法
4.1集中式搜寻简介
4.2集中式搜寻程序的系统结构
4.3集中式搜寻算法的研究现状
4.3.1HIT算法
4.3.2 Context Graph算法
4.3.3小结
第五章均值-传递算法
5.1专题的表示
5.1.1向量空间模型
5.1.2专题特征词的获取
5.1.3分词中的专有词汇获取机制
5.2相关度的预测
5.2.1均值模型
5.2.2传递模型
5.2.3 均值——传递模型
5.2.4相关度验证和反馈
5.2.5相关度的计算
5.3隧道效应和搜寻极限
5.3.1隧道效应的集中度自适应解决方法
5.3.2搜寻极限的判断
5.4辅助搜寻策略
5.4.1网站的专题相关度判断
5.4.2待访问URL队列的裁减
第六章试验与结果分析
6.1试验简介
6.1.1前期工作
6.1.2试验设备情况
6.2试验结果与讨论
6.3小结
第七章总结与展望
参考文献
附录
致谢
独创性声明