数据挖掘方法在评论分类中的应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的快速发展和普及，网络已经成为人们生活不可或缺的一部分。人们通过互联网看书、视频、学习、讨论、购物时常常会在相关页面上留下关于该页面主题的评论。特别地，消费者在电商网站上进行网购之后都会留下关于购买产品的评论信息。目前，随着网络上的评论信息剧增，评论数据的有效利用问题已经越来越收到人们的关注。面对大量的评论数据，如何从中挖掘到有用的信息对网站用户、服务商、生产商都有着重要的意义。然而页面上的评论信息属于非结构化数据，也就是代表评论数据本身并没有一个预定义的数据模型。由于评论数据的不规则性和不明确性，使得其相对于按字段存储在数据库的数据难以用传统的程序进行分析、统计或归纳。如何从海量的评论数据中提取有用的信息以方便用户、服务商和生产商有效、快捷地利用是本文主要探讨的问题。
　　本文的主要任务包括对评论数据进行的情感分类和进行基于价值分类。对于评论的情感分类，文本提出一种基于情感词抽取和点互信息的非监督学习方法。其中，对句子进行分词、词性识别并从中抽取情感词，减少了分类时噪声的引入。通过计算情感词和范例词的PMI值得出一个评论文档的情感倾向。对于用户而言，评论数据情感倾向并不能满足评论阅读者的需求，因此提出一种基于引入指向特征的最大熵模型方法对评论数据进行价值分类。该方法认为评论数据中有价值的信息除了与文本长度、是否存在描述性词语等特征相关还与评论文本是否指向主题相关。提出一种基于IP树的文本指向识别方法，对识别结果作为特征引入到模型训练中，实验证明该方法构造的分类器具有较好的分类效果。

著录项

作者
李杰骏;
展开▼
作者单位

广东工业大学;

展开▼
授予单位广东工业大学;
学科计算机技术
授予学位硕士
导师姓名左亚尧,纪友庆;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
评论信息; 数据挖掘; 情感分类; 价值分类;

相似文献

中文文献
外文文献
专利

1. 并行数据库中异常数据优化分类挖掘方法研究 [J] . 杨秀荣 . 微电子学与计算机 . 2015,第10期
2. 数字挖掘方法在遥感分类中的应用研究 [J] . 赵勇 ,刘凯 . 北京测绘 . 2009,第003期
3. 模糊粗糙集数据挖掘方法在电力变压器故障诊断中的应用研究--基于油中溶解气体的分析诊断 [J] . 董立新 ,肖登明 ,王俏华 . 电力系统及其自动化学报 . 2004,第005期
4. 数据挖掘方法在反恐情报分析中的应用研究 [J] . 扈翔 . 情报探索 . 2017,第011期
5. 数据挖掘方法在教学质量评价中的应用研究 [J] . 郝勇智 . 山西电子技术 . 2015,第005期
6. 数据挖掘方法在核反应堆主泵故障诊断中的应用研究 [C] . 艾琼 ,刘才学 ,何攀 . 第二十一届测试与故障诊断技术研讨会 . 2012
7. 基于贝叶斯理论的数据挖掘方法在电子邮件分类中的应用研究 [A] . 李少猷 . 2007

数据挖掘方法在评论分类中的应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅