首页> 中文学位 >在线评论中产品特征提取与意见挖掘研究
【6h】

在线评论中产品特征提取与意见挖掘研究

代理获取

目录

声明

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文的主要研究内容

1.4 本文的组织结构

第2章 基于副词的评价要素的迭代提取

2.1 在线产品评论的分类及特点

2.2 自扩展方法BootStrapping

2.3 基于副词的产品评论要素迭代提取算法

2.4 实验及分析

2.5 本章小结

第3章 同义产品特征词的识别方法研究

3.1 中文同义词的识别方法

3.2 中文词语语义资源

3.3 同义产品特征识别方法设计

3.4 实验结果及分析

3.5 本章小结

第4章 基于聚类算法的评价单元情感倾向性研究

4.1 基于k-中心点的改进算法分析

4.2基于NKM的情感倾向性分析

4.3 实验结果及分析

4.4 本章小结

第5章 在线产品评论意见挖掘系统的设计与实现

5.1 系统的整体框架设计

5.2 系统实现及演示

5.3 本章小结

第6章 总结与展望

6.1 本文总结

6.2 未来展望

致谢

参考文献

展开▼

摘要

随着WEB2.0技术的快速发展,几乎所有类型的网络平台上都会有评论信息的功能模块,越来越多的消费者会在这些网络平台上发表产品评论信息。这些产品评论中蕴藏着丰富的有价值的信息,一方面可以帮助消费者做出正确的购买决策,另一方面可以帮助企业了解消费者的切实需求,逐步完善产品质量。由于在线产品评论规模庞大,人工难以阅读完所有的评论。因此,对在线产品评论进行自动分析,挖掘出评论文本中的意见要素,并以清晰、直观的方式对结果进行展示,具有重要的研究价值。本文从细粒度层面,即基于产品特征,对在线产品评论进行意见挖掘,主要的工作内容总结如下:
  1)针对现有的评论要素提取查全率低、具有领域依赖性的问题,对大量评论语料的词法结构进行分析后,本文提出了基于副词的评论要素的迭代提取方法。首先基于跨领域的种子副词实现副词与意见词的迭代提取,然后基于意见词实现特征词与意见词的迭代提取。另外,针对提取过程中可能产生噪声的原因,本文使用了三种方法对候选产品特征进行修剪过滤。
  2)由于不同的用户可能使用不同的词语来表示同一个产品特征,因此需要将各个特征的同义词进行合并。在现有的同义词识别的研究中,基于词汇字面计算相似度或者基于语义词典计算相似度的方法都存在固有的缺陷。鉴于此,本文充分利用已有的词典资源,并结合特征词汇所在的上下文信息制定相似度计算规则,在一定程度上互补,提高了同义产品特征词识别的查全率。
  3)针对已有的极性判断方法无法判断部分意见词极性的缺点,本文提出了基于聚类算法的情感极性判断方法。通过对大量评论语料的统计,总结影响特征意见词对情感极性的因素,以此制定规则来初始化评价单元(特征词,意见词,否定词个数,修饰副词)之间的相似度。然后基于改进的k-中心点聚类算法对评价单元进行聚类,实现同极性的评价单元聚在同一簇中,最后根据每个簇中的种子情感词的极性来确定整个簇的极性。
  最后,基于上述的工作成果,本文设计并实现了在线产品评论意见挖掘原型系统。该系统能够有效地挖掘出评论中蕴藏的有价值的信息,展示消费者们对产品各个特征的情感倾向情况。

著录项

  • 作者

    夏雨;

  • 作者单位

    武汉理工大学;

  • 授予单位 武汉理工大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 姚寒冰;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    在线评论; 产品特征; 信息提取; 意见挖掘;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号