声明
摘要
1 绪论
1.1 论文的研究背景和意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 主要研究内容
1.4 论文结构
2 关键技术介绍
2.1 舆情信息采集技术
2.2 网页正文提取算法
2.3 热点话题检测
2.4 本章小结
3 社会热点话题网络舆情分析平台总体设计
3.1 社会热点话题网络舆情分析平台需求分析
3.1.1 设计要求
3.1.2 平台功能需求
3.2 平台总体设计
3.2.1 平台总体架构
3.2.2 平台基本业务流程
3.2.3 平台功能模块设计
3.3 本章小结
4 基于结构相似网页聚类的正文提取算法研究
4.1 网页结构特征分析
4.1.1 基本概念
4.1.2 网页结构相似性
4.2 基于结构相似网页聚类的网页正文提取
4.2.1 网页相似度计算
4.2.2 网页正文提取
4.2.3 算法分析
4.3 实验结果及分析
4.3.1 实验环境与数据
4.3.2 评价标准
4.3.3 实验结果
4.4 本章小结
5 热点话题识别关键技术研究
5.1 热点话题发现流程
5.2 话题聚类算法
5.2.1 话题发现文本聚类算法及比较
5.2.2 改进的Single-Pass聚类算法
5.3 话题热度评估
5.4 本章小结
6 平台实现及测试
6.1 平台开发环境
6.2 平台实现效果
6.3 本章小结
结论
致谢
参考文献
攻读学位期间的研究成果