基于评论分析的 Blog 观点提取技术研究
BLOG VIEWPOINT EXTRACTIONBASED ON COMMENT
摘 要
Abstract
目 录
第1章 绪论
1.1 研究背景和意义
1.1.1 研究的背景
1.1.2 研究的意义
1.2 国内外相关研究综述
1.2.1 垃圾评论过滤技术现状
1.2.2 观点分析研究现状
1.3 研究问题的定义
1.3.1 基本定义
1.3.2 问题描述
1.4 本文的结构安排
第2章 Blog 基本理论
2.1 引言
2.2 Blog 概述
2.2.1 Blog 概念
2.2.2 Blog 特点
2.3 Blog 数据模型
2.4 本章小结
第3章 垃圾评论过滤技术
3.1 引言
3.2 垃圾评论定义
3.2.1 狭义的垃圾评论定义
3.2.2 广义的垃圾评论定义
3.3 垃圾评论特征
3.3.1 评论内容高度重复性
3.3.2 垃圾评论者集合性
3.3.3 垃圾链接集合性
3.3.4 垃圾评论发布时间的局部密集性
3.4 垃圾评论识别技术
3.5 垃圾评论过滤算法
3.5.1 评论内容分析
3.5.2 评论连接分析
3.5.3 发布时间分析
3.5.4 算法描述
3.6 实验与分析
3.6.1 实验数据描述
3.6.2 算法评价标准
3.6.3 算法性能分析
3.6.4 垃圾评论过滤算法分析
3.7 本章小结
第4章 基于评论分析的Blog 观点标注算法
4.1 引言
4.2 Blog 观点标注技术
4.3 Blog 的文本表示与特征选择
4.3.1 构造特征空间
4.3.2 文本表示
4.3.3 特征项选择
4.3.4 特征项权重计算
4.4 Blog 观点标注算法
4.4.1 评论数目分析
4.4.2 相似度分析
4.4.3 特殊感情词汇分析
4.4.4 算法描述
4.5 实验与分析
4.5.1 实验数据描述
4.5.2 算法性能分析
4.5.3 观点提取算法分析
4.5.4 对比算法分析
4.6 本章小结
第5章 Blog 观点提取系统
5.1 引言
5.2 系统功能目标及开发环境
5.2.1 系统功能目标
5.2.2 开发平台及工具
5.3 系统总体设计
5.4 系统详细设计
5.4.1 XML 解析模块
5.4.2 垃圾评论过滤模块
5.4.3 情感词提取模块
5.4.4 Blog 观点提取模块
5.5 系统可视化界面
5.6 本章小结
结 论
参考文献
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致 谢
哈尔滨工业大学;