摘 要
Abstract
第一章引言
1.1研究背景
1.2本文的工作成果
1.3本文组织
第二章相关研究
2.1 Web权威资源发现的常用算法
2.1.1 HITS(Hyperlink-Induced Topic Search)算法
2.1.2 PageRank算法
2.1.3社团(Community)挖掘
2.2频繁模式的挖掘算法
2.3网络抓取程序
2.4一些常用的数据模型
2.5本章小结
第三章FARMING算法描述
3.1基本术语和定义
3.1.1频繁度(freq),支持度(sup),频繁(子)图
3.1.2权威页面,权威社团
3.2算法准备——生成图库
3.2.1图库生成方法
3.2.2 PageSnagger
3.2.3生成图库存放格式
3.3算法过程
3.4实验分析
3.4.1权威页面
3.4.2权威社团
3.4.3小结
3.5本章结论
第四章SFP算法描述
4.1无向图SFP算法描述
4.2为Web挖掘环境修改原始SFP算法
4.3性能比较
4.3本章小结
第五章改进方向和系统展望
5.1 改进方向
5.2 系统展望
参考文献
致 谢
附录文章与项目
论文独创性声明和论文使用授权声明