声明
摘要
第1章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状
1.2.1 话题发现
1.2.2 BBS热点话题发现
1.3 本文的研究重点
1.4 本文的结构安排
第2章 相关理论和技术研究
2.1 热点话题发现的流程
2.2 BBS概述
2.2.1 BBS的相关概念
2.2.2 BBS的文本特点
2.3 网络数据采集
2.3.1 随机搜索
2.3.2 垂直搜索
2.3.3 定向搜索
2.4 Web信息抽取
2.4.1 Web信息抽取概念
2.4.2 Web信息抽取技术分类
2.4.3 Web信息抽取的评价指标
2.5 文本表示
2.5.1 分词
2.5.2 文本表示模型
2.5.3 特征选择方法
2.5.4 文本相似度计算
2.6 基于时间推移的演化理论
2.7 文本聚类算法
2.7.1 Single-Pass单遍聚类算法
2.7.2 基于语义或本体的聚类算法
2.7.3 增量聚类算法
2.7.4 层次聚类算法
2.7.5 K-means聚类算法
2.7.6 聚类的评价指标
2.8 本章小结
第3章 教育BBS热点话题发现算法设计
3.1 教育BBS热点话题发现系统设计
3.1.1 教育BBS热点话题发现的目标
3.1.2 教育BBS热点话题发现的过程
3.2 教育BBS热点话题发现的方法
3.2.1 BBS教育话题表达规律
3.2.2 BBS数据采集
3.2.3 BBS信息抽取
3.2.4 BBS文本表示
3.2.5 BBS话题发现
3.2.6 BBS热度评价
3.3 本章小结
第4章 教育BBS热点话题发现系统的实现与结果分析
4.1 实验语料与实验环境
4.2 系统数据库设计
4.3 教育BBS信息抽取方法实现与结果分析
4.3.1 关键算法实现
4.3.2 实验数据
4.3.3 实验结果与分析
4.4 教育BBS单遍聚类方法实现与结果分析
4.4.1 聚类算法的实现
4.4.2 实验数据
4.4.3 实验结果与分析
4.5 教育BBS热点话题发现系统的整体实现
4.5.1 界面展示
4.5.2 功能说明
4.6 本章小结
第5章 总结与展望
5.1 本文总结
5.2 工作展望
参考文献
致谢