文摘
英文文摘
声明
1绪论
1.1研究现状
1.1.1个性化服务研究现状
1.1.2捕获技术的研究现状
1.2研究方向及意义
1.3论文组织结构
1.4本章小结
2基于浏览行为的网页捕获
2.1用户浏览行为分析
2.1.1浏览行为的特征
2.1.2浏览行为的分类
2.1.3用户浏览行为的选取
2.2用户浏览数据的采集
2.2.1浏览数据的获取途径
2.2.2浏览数据采取手段的选择
2.2.3隐私与保护
2.3实现方法
2.3.1 BHO技术
2.3.2钩子技术
2.3.3自定义IE按钮
2.3.4捕获过程
2.4本章小结
3基于量化计算的兴趣网页发现
3.1基于行为分析的网页兴趣度量化计算
3.1.1浏览行为的计算
3.1.2浏览行为的数据结构
3.1.3网页兴趣度的量化计算
3.2兴趣网页的发现
3.2.1异常网页处理
3.2.2特殊网页的处理
3.3用户行为参数的自适应
3.4本章小结
4基于搜索词的网页兴趣度调整
4.1搜索词的捕获
4.1.1 URL分析
4.1.2捕获搜索词
4.2字符编码转换
4.2.1 Unicode编码
4.2.2 GBK编码
4.2.3 UTF-8编码
4.2.4编码转换
4.3基于搜索词的兴趣度调整
4.3.1搜索词的分词
4.3.2搜索词典的建立
4.3.3基于搜索词的兴趣度调整
4.4本章小结
5实验结果与分析
5.1个性化搜索原型系统介绍
5.1.1个性化搜索原型系统组成
5.1.2兴趣网页提取效果的评价方法
5.2兴趣网页自动提取效果实验分析
5.2.1实验内容和流程
5.2.2实验结果分析
5.3搜索词对边界兴趣网页判定的作用
5.4对兴趣聚类数目的影响
5.5本章小结
6总结与展望
致 谢
参考文献
附录:作者在攻读学位期间发表的论文目录