文摘
英文文摘
第一章 绪论
1.1 课题的研究背景及意义
1.2 搜索引擎的发展历史及研究现状
1.2.1 搜索引擎发展历史
1.2.2 搜索引擎研究现状
1.3 本文的研究内容
1.4 本文的组织结构
第二章 搜索引擎关键技术研究
2.1 搜索引擎概述
2.1.1 搜索引擎工作流程
2.1.2 搜索引擎体系结构
2.1.3 搜索引擎的发展趋势
2.2 机器爬虫
2.2.1 HTTP协议
2.2.2 爬取策略
2.2.3 网页爬取
2.3 原始信息预处理
2.3.1 信息预处理的系统结构
2.3.2 索引网页库
2.3.3 中文分词
2.3.4 网页分析与建立倒排文件
2.4 检索服务
2.4.1 检索服务的系统结构
2.4.2 检索的定义
2.4.3 查询服务
2.5 本章总结
第三章 中文分词系统
3.1 中文分词系统概述
3.2 分词算法介绍
3.3 逆向最大匹配算法
3.4 中文分词的难点
3.5 中文分词的评价标准
3.6 一种提高中文分词准确率的方法
3.6.1 数据结构设计
3.6.2 混合字典
3.6.3 分词算法
3.6.4 实验结果
第四章 WEB挖掘在个性化服务中的应用
4.1 WEB挖掘技术
4.2 WEB文本挖掘
4.3 WEB个性化简述
4.4 基于WEB挖掘个性化服务系统的比较
4.5 WEB挖掘技术在个性化系统中存在的问题
4.6 基于WEB挖掘的个性化技术的发展
第五章 个性化搜索引擎模型设计
5.1 个性化检索系统研究现状
5.2 用户兴趣的获取
5.2.1 页面特征提取
5.2.2 用户兴趣获取的一般方法
5.2.3 基于用户浏览行为挖掘
5.3 用户个性化模型研究
5.3.1 用户个性化模型表示
5.3.2 用户兴趣的存储
5.3.3 用户兴趣模型的建立与更新
5.4 个性化搜索引擎模型
5.4.1 用户个性化搜索引擎模型系统结构
5.4.2 查询优化
5.4.3 页面信息挖掘
5.4.4 个性化信息过滤
5.5 本章总结
第六章 结论与展望
6.1 本文总结
6.2 不足与展望
致谢
参考文献
攻硕期间取得的研究成果
论文修改提纲