首页> 中文学位 >基于商品特征挖掘的在线评论有用性分类研究
【6h】

基于商品特征挖掘的在线评论有用性分类研究

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景与意义

1.1.1 研究背景

1.1.2 研究意义

1.2 研究内容与组织结构

1.3 研究方法与研究路线

2 国内外研究综述

2.1 评论挖掘

2.2 商品特征挖掘

2.2.1 基于英文评论的商品特征挖掘

2.2.2 基于中文评论的商品特征挖掘

2.3 评论有用性影响因素

2.3.1 评论有用性概念

2.3.2 影响因素

2.4 评论有用性分类

2.4.1 评论特征选择

2.4.2 评论有用性分类算法

2.5 本章小结

3 基于在线评论的商品特征挖掘

3.1 问题描述

3.2 在线评论分词

3.3 特征候选集提取

3.4 商品特征的选择

3.4.1 TF-IDF

3.4.2 情感指数

3.5 数值实验与结果讨论

3.6 本章小结

4 基于商品特征信息的评论特征选择

4.1 基于评论内容信息的评论特征

4.1.1 评论长度

4.1.2 句子数量

4.1.3 平均句子长度

4.1.4 商品评级

4.2 基于商品特征信息的评论特征

4.2.1 商品特征数量

4.2.2 句平均特征数量

4.2.3 特征情感词数量

4.2.4 平均特征权重

4.3 其他评论特征

4.3.1 错别字数量

4.3.2 有无重复评论

4.4 本章小结

5 基于TSVM的评论有用性分类

5.1 问题描述

5.2 评论有用性定义

5.2.1 有用评论

5.2.2 无用评论

5.3 评论有用性的半监督分类算法

5.3.1 半监督学习方法

5.3.2 TSVM算法介绍

5.4 数值实验与结果讨论

5.5 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

随着电子商务的快速发展,越来越多的消费者习惯于网上购物。消费者在发生购买行为后,可以对已购买的商品进行评论,这些评论不仅是消费者对商品卖家的反馈,同时也能对其他消费者提供建议和指导。商品的热销意味着商品评论的大量增加,某些火爆的商品动辄数万条的评论让卖家和买家都难以处理,这就需要双方从海量的商品评论中快速地筛选出有用的评论,从大量冗余的信息中提取出真正可以指导销售和购买的有用信息。
  对海量在线评论中有用信息的迫切需求使得国内外研究者都不约而同地关注起了评论挖掘的一个具体的应用领域——评论有用性分类。本研究考虑到各大电商网站普遍无法提供全面的评论信息这一现实情况,从评论内容本身及商品特征信息入手,通过商品特征挖掘为评论有用性分类特征的选取提供参考;为了充分利用海量的评论,本研究采用半监督学习的方法对分类模型进行训练,最终得到有优异性能的评论有用性分类模型。
  论文首先研究已有商品特征挖掘方法的不足,从分词、剪枝和特征选取等方面进行有效改进,最后得到优化的商品特征挖掘结果;在此基础上,深入研究评论有用性的影响因素,将商品特征信息作为一个重要参考因素加入到有用性分类特征集合中;最后利用支持向量机的重要扩展——直推式支持向量机进行半监督学习,综合利用有标签评论和无标签评论,训练出在线评论有用性的半监督分类模型。结果显示该分类模型表现优于传统的监督学习模型,在只考虑评论内容信息条件下有较好的表现,进而说明商品特征信息是影响评论有用性的重要因素,而半监督学习可以有效地提升分类结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号