文摘
英文文摘
前言
第一章 信息发现技术的发展与现状
1.1 信息发现(Information Retreival)技术介绍
1.1.1 信息发现技术的出现
1.1.2 信息发现技术的发展
1.2 WWW信息发现技术
1.2.1 著名WWW搜索引擎
1.2.2 WWW搜索引擎基本工作方式
1.3 信息发现研究热点及相关成果
1.3.1 分布式体系结构
1.3.2 通用搜索引擎原型系统
1.3.3 检索算法
1.4 Gonia系统介绍
1.4.1 分布式体系结构
1.4.2 中文切词的双字切分法
1.4.3 基于噪声识别和消除的相关度计算方法
第二章 超链分析的引入及定义
2.1 背景
2.2 超链分析的引入
2.2.1 超链及其分类
2.2.2 引入超链分析对信息发现技术的帮助
2.3 超链聚类算法
2.3.1 关于超链的一些定义
2.3.2 算法描述
2.3.3 算法的应用探讨
2.4 在Gonia系统中引入超链分析的实现
2.4.1 系统总体结构
2.4.2 数据格式更新
第三章 基于超链分析的结果压缩研究
3.1 背景
3.2 搜索引擎返回结果的压缩算法
3.3 访问基的选择探讨
3.4 关于复合rank计算的探讨
3.5 实现
3.5.1 系统的改进功能
3.5.2 数据结构描述
3.5.3 程序结构流程
3.6 实验结果分析
3.6.1 实验背景及目的
3.6.2 实验方法及过程
3.6.3 实验结果及分析
第四章 搜索引擎目录索引的自动生成
4.1 背景
4.2 分类索引自动生成
4.2.1 分类Web页面的选出
4.2.2 基于超链分析的资源发现
4.2.3 镜像页面的发现
4.3 系统模型构建
4.4 实现
4.4.1 系统功能描述
4.4.2 程序结构及流程
4.5 实验结果分析
4.5.1 实验背景及目的
4.5.2 实验方法及过程
4.5.3 实验结果及分析
第五章 总结
5.1 论文工作总结
5.2 有待进一步研究的问题
参考文献
作者参与的工作和发表的论文
致谢