文摘
英文文摘
声明
第1章绪论
1.1研究背景
1.2兴趣挖掘的研究现状
1.3本文的主要工作及章节安排
第2章Web用户兴趣挖掘模型
2.1 Web挖掘
2.1.1 Web挖掘的意义
2.1.2 Web挖掘的分类
2.1.3 Web挖掘的数据来源
2.1.4 Web挖掘的主要流程
2.2用户兴趣挖掘的途径与方法
2.3 KHN用户兴趣挖掘方法
2.3.1兴趣定义
2.3.2 KHN兴趣挖掘模型
2.4 KHN用户兴趣模型分析
2.4.1页面兴趣提取
2.4.2页面相似度评价
2.4.3文本聚类
2.5本章小结
第3章基于SWN理论的关键字提取
3.1引言
3.2基本概念
3.3小世界网络模型及其在文本关键字提取中的应用
3.3.1小世界网络模型
3.3.2小世界网络模型在文本关键字提取中的应用
3.4关键字提取算法
3.4.1算法的处理思想
3.4.2文档语义结构图生成算法
3.4.3文档关键字提取算法
3.4.4算法的时间复杂度分析
3.5本章小结
第4章兴趣挖掘方法
4.1文本特征选择
4.2文本相似度计算
4.3文本聚类
4.3.1 GN算法
4.3.2 Newman算法
4.3.3基于图的文本聚类算法
4.4兴趣提取
4.5本章小结
第5章实验系统设计与实现
5.1实验原型系统的设计目标及原则
5.1.1实验原型系统的设计目标
5.1.2实验原型系统的设计原则
5.2功能结构设计
5.3关键字提取模块实现
5.4兴趣提取模块实现
5.4.1构图子模块实现
5.4.2聚类子模块实现
5.4.3兴趣生成子模块实现
5.5 Web用户感兴趣页面的捕获模块
5.5.1软件捕获数据包技术
5.5.2 Winpcap简介
5.5.3捕获Web用户感兴趣的页面
5.6实验系统的运行结构
5.7实现环境
5.8本章小结
第6章实验结果与分析
6.1数据集和实验环境
6.2关键字提取系统
6.3文本聚类
6.4兴趣提取
6.5本章小结
第7章结论与展望
7.1本文总结
7.2展望
参考文献
附录
攻读学位期间取得的研究成果
致谢