封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1研究背景及意义
1.2国内外研究现状
1.3本文的主要工作
1.4本文的组织结构
第二章 互联网文本挖掘概述
2.1 文本挖掘概述
2.2 互联网文本数据挖掘概述
2.3 本章小结
第三章 基于HtmlParser的网页数据自动抽取
3.1常用的网页数据抽取方法
3.2 常用的网页数据抽取模型
3.3 HtmlParser概述
3.4 基于HtmlParser的网页数据自动抽取
3.5 本章小结
第四章 新闻检索结果聚类分析
4.1 检索结果聚类概述
4.2 总体框架
4.3 基于Lucene的索引数据库
4.4 关键短语抽取
4.5 聚类算法分析
4.6 类标签提取
4.7 本章小结
第五章 互联网新闻数据在线挖掘服务系统
5.1 系统开发背景
5.2 系统的物理结构
5.3 系统的逻辑结构
5.4 检索结果聚类分析
5.5 系统界面效果图
5.6 本章小结
第六章 总结与展望
致谢
参考文献
个人简介和攻读硕士期间的成果