文摘
英文文摘
第一章 绪论
1.1 产品评论挖掘技术研究的背景和意义
1.2 亟待解决的两大问题
1.2.1 非结构化评论数据的自动提取与分类
1.2.2 评论中感情色彩的自动判断
1.3 国内外的研究现状
1.4 论文的内容和结构
第二章 评论挖掘系统中的关键技术及框架
2.1 问题重述
2.2 关键技术及框架介绍
2.2.1 评论数据采集和预处理
2.2.2 数据的训练和分类
2.2.3 特征观点对的提取
2.2.4 感情色彩判断
2.3 本章小结
第三章 评论数据收集和特征提取
3.1 引言
3.2 相关方法
3.2.1 聚焦爬虫
3.2.2 中文分词
3.2.3 停用词处理
3.3 数据收集和预处理
3.3.1 网页提取和编码转换
3.3.2 分词和停用词处理
3.4 评论数据的特征提取
3.4.1 特征观点对
3.4.2 特征提取算法的框架
3.4.3 特征词、观点词和程度词的判定
3.4.4 特征词匹配方向的判定
3.4.5 特征词的匹配原则
3.5 实验及结果
3.5.1 评论数据采集的演示实验
3.5.2 分词和停用词处理的演示实验
3.5.3 特征观点对的提取实验
3.6 本章小结
第四章 评论数据的训练和分类
4.1 引言
4.2 相关方法
4.2.1 文本的表示方法
4.2.2 LSA算法
4.2.3 PLSA算法
4.2.4 概率模型下相似性度量方法
4.2.5 聚类效果的评价方法
4.3 语料库数据的训练
4.4 训练数据分类
4.4.1 主题种子词的提取
4.4.2 词语间相似度的计算
4.4.3 主题聚类
4.5 实验及结果
4.5.1 语料库数据的训练实验
4.5.2 训练数据分类实验
4.6 本章小结
第五章 感情色彩的自动提取
5.1 引言
5.2 感情色彩提取
5.2.1 感情色彩倾向度
5.2.2 倾向度的计算
5.2.3 感情色彩提取流程
5.3 感情色彩的提取实验及结果
5.3.1 语料库中部分数据演示实验
5.3.2 全体数据的实验结果
5.4 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
附录 词性标注符号集
参考文献
致谢