声明
摘要
第一章 绪论
1.1 引言
1.2 国内外研究现状
1.3 本文的主要工作
1.4 本文结构安排
第二章 相关理论和技术
2.1 TDT相关知识
2.1.1 TDT中的基本概念
2.1.2 TDT的主要任务
2.1.3 TDT的评测方法
2.2 热点话题发现模型
2.3 文本聚类
2.4 本章小结
第三章 热点话题发现
3.1 热点发现的整体框架
3.2 信息采集
3.2.1 网络爬虫
3.2.2 内容抽取
3.3 信息预处理
3.3.1 中文分词技术
3.3.2 分词、词性标注
3.3.3 特征选择
3.3.4 文本的向量表示
3.4 信息挖掘
3.4.1 Single-Pass聚类算法
3.4.2 改进的Single-Pass算法
3.4.3 热度计算
3.5 抽取案例
3.6 本章小结
第四章 热点话题发现系统
4.1 系统概述
4.2 系统的开发平台与开发环境
4.3 系统数据库表设计
4.4 系统演示
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
华中师范大学;