文摘
英文文摘
声明
第1章绪论
1.1课题背景
1.2搜索引擎的发展
1.3搜索引擎技术概况
1.3.1搜索引擎的分类
1.3.2当前搜索引擎的缺点
1.4国内外研究现状
1.5课题内容
1.6本文主要研究内容和章节安排
第2章搜索引擎系统分析
2.1搜索引擎模块结构
2.1.1信息搜集子系统
2.1.2索引子系统
2.1.3检索子系统
2.2搜索引擎工作流程
2.2.1网页搜集
2.2.2预处理
2.2.3查询服务处理
2.3搜索引擎与检索器
2.4搜索引擎关键技术
2.4.1大规模数据搜集技术
2.4.2大规模数据索引技术
2.4.3超文本链接的研究
2.4.4自动分类技术
2.4.5相关度算法
2.5本章小结
第3章 语言文字特点及维、哈、柯搜索引擎关键技术
3.1维、哈、柯语言文字特点
3.2维、哈、柯文搜索引擎关键技术
3.3本章小结
第4章 维、哈、柯多文种搜索引擎设计
4.1.维、哈、柯多文种搜索引擎总体结构设计
4.2数据库设计
4.3主要功能模块设计
4.3.1 数据采集模块(爬行器)设计
4.3.2文档处理模块(分析器)设计
4.3.3索引模块(索引器)设计
4.3.4 检索服务模块(检索器)设计
4.4本章小结
第5章 检索器关键技术的实现
5.1维、哈、柯文在线处理的实现
5.2查询词的检错与纠错算法实现
5.3查询词词干切分算法实现
5.4同化(弱化)处理算法实现
5.5本章小结
第6章 检索器与查询处理的实现
6.1多文种Web页面
6.2查询短语预处理
6.2.1过滤空格及停用词
6.2.2重构查询短语
6.3基于词根的索引及查询
6.4动态生成文档摘要
6.5结果显示
6.6本章小结
结论及展望
参考文献
攻读硕士学位期间发表的学术论文及研究成果
致谢