首页> 中文学位 >基于客户评论的电商产品特征提取的研究
【6h】

基于客户评论的电商产品特征提取的研究

代理获取

目录

声明

摘要

图目录

表目录

第一章 绪论

1.1 特征词提取

1.2 情感分析中的特征提取

1.3 研究目的与主要工作

1.4 论文组织结构

第二章 研究现状

2.1 文本挖掘技术

2.2 情感分析方法

2.3 关键词提取算法

2.4 本章小结

第三章 文本提取算法在特征词提取研究中的改进与实现

3.1 特征词提取算法综述

3.2 基于词频的特征提取的改进与实现

3.2.1 基于Stanford CoreNLP的文本解析

3.2.2 在基于词频的特征提取算法中的剪枝

3.2.3 基于词频的提取算法

3.3 基于Web PMI的特征提取技术

3.3.1 点问互信息(PMI)在特征词提取中的应用

3.3.2 从Google搜索引擎获取并存储命中数功能模块

3.3.3 基于Web PMI值的特征提取算法

3.4 快速自动关键词提取方法的实现

3.4.1 快速文本解析技术

3.4.2 共现值在RAKE算法中的应用

3.4.3 RAKE算法

3.5 本章小结

第四章 特征词提取算法解析与实验

4.1 数据集的分析

4.2 Weka分析平台

4.2.1 Weka综述

4.2.2 数据格式预处理

4.3 实验分析

4.3.1 准确率和召回率分析

4.3.2 时间复杂度分析

4.3.3 鲁棒性分析

4.4 本章小结

第五章 基于词频的快速特征词提取算法

5.1 算法分析与设计

5.1.1 提取算法的技术方法分析

5.1.2 算法设计方案

5.2 基于词频的快速特征词提取(RFWE)算法

5.3 实验分析

5.3.1 RFWE算法的准确率和召回率分析

5.3.2 RFWE算法的时间复杂度分析

5.3.3 四种提取算法的对比分析

5.4 本章小结

第六章 论文总结与未来工作

6.1 论文总结

6.2 未来工作

致谢

参考文献

展开▼

摘要

近年来,越来越多的人选择在电子商务网站上购买产品,并发表对产品的评论,通过评论,可以得知客户对产品的观点和看法。这些隐藏在评论中的信息,一方面可以帮助潜在用户了解产品信息,人们已经习惯于在确认购买订单前查看产品的在线客户评论,另一方面,也可以帮助制造商收集分析客户的评论反馈,确定未来产品方向。但是,对于客户和制造商们而言,快速从大量评论中获取有用信息是十分困难的,因此,自动分析评论信息已经成为了一个十分有意义的研究课题。
  本论文主要研究产品特征词提取,特征词指的是产品组件或产品属性,用来反映客户对产品的关注点和兴趣点。针对产品特征词提取问题目前的研究现状,本论文进行了相关的系统研究,在此研究基础上,本论文设计并实现了一种新的基于词频的快速特征词提取(RFWE)算法,对特征词提取算法的性能进行提升。
  论文的主要工作如下:
  1)部分改进并实现了三种热门文本提取算法,分别是基于词频的特征提取算法、基于Web PMI的特征提取算法、快速自动的关键词提取(RAKE)算法。与原算法不同的是,本论文统一采用了更为高效的Stanford CoreNLP文本解析工具,设计了一个从Google搜索引擎获取的命中数并存储到本地数据库的模块,具有高频名词统计分析,计算上下文间的信息量(关联度)等功能。
  2)基于预先人工标记的Amazon产品数据集,对每个算法的性能进行实验对比,提供客观的评价分析,实验分析包括以下几个方面:准确率和召回率分析、时间复杂度分析和鲁棒性分析,从多方面评估特征词算法的性能优缺点。
  3)基于目前的特征词提取算法和实验分析结果,设计并实现了RFWE算法,RFWE算法结合了热门算法中的优势技术方法,如RAKE算法的文本解析技术、基于词频的特征词提取算法的剪枝方法,通过实验发现,新算法在准确率、召唤率和时间复杂度方面有着不错的表现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号