首页> 中文学位 >服装类商品评论的特征提取及语义分析
【6h】

服装类商品评论的特征提取及语义分析

代理获取

目录

第一个书签之前

展开▼

摘要

随着Web2.0与B2C商务模式的飞速发展,网络购物已成为人们生活中不可或缺的一部分,电商平台上用户评论的数量呈现出爆炸式的增长趋势。这些评论中包含了大量有价值的信息,是用户作出购买决策的重要参考依据,也是商家了解用户反馈的信息来源。这些评论数量庞大,质量参差不齐,因此如何对海量评论进行有用信息的挖掘成为一个值得研究的问题。商品特征的抽取与语义分析是意见挖掘过程中的两个基础而核心的任务。目前很多方法同时抽取商品特征词以及其对应的评价词,但将它们应用于服装领域的评论时结果不尽如人意。有必要对现有的基于频繁项集挖掘以及句法树分析的特征提取方法进行研究,改善其中的不足,在不影响召回率的情况下提高商品特征提取的准确率。 基于以上背景,本文以电商网站的商品评论作为研究对象,以提取商品特征词以及其评价词为目标。工作内容可概括为如下方面: 介绍了商品特征提取的研究背景、研究现状及相关技术;然后针对缺乏服装领域语义规则集这一现象,提出了通过迭代学习法构建语义规则集,并将其应用于抽取商品特征词。用该语义规则集进行了商品特征的抽取实验进行验证。 针对现有的基于频繁项集的商品特征提取方法中只考虑支持度而未考虑词语间的语义相似度与语义结构这一问题,提出了基于改进的FP-Growth算法的商品特征提取方法。在研究中通过构造种子集过滤明显语义不相关项;通过考虑低频元素项的语义相似度,避免低频特征被误删;利用Word2Vec模型进行语义相似度计算;利用语义规则模板,将语义结构的频率特征隐含在算法中,用于寻找潜在商品特征词。最后通过对比实验验证了改进的FP-Growth算法的优越性。 将评论分为子句,利用斯坦福分析器对子句进行句法树结构分析,总结出了服装领域的商品特征模式库,并建立了泛化规则。利用该分析方法对四个品牌客户的评论进行分析与结果展示。 以依存句法分析以及找到的商品特征词为基础,建立了一系列依存规则抽取库(包括主谓关系、谓宾关系、定语修饰关系等)。使用该规则库进行特征词与评价词对的抽取,并将实验结果与传统的最近距离法进行对比分析。

著录项

  • 作者

    陈婕;

  • 作者单位

    东华大学;

  • 授予单位 东华大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 史有群;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 I20;
  • 关键词

    服装; 品评论; 特征提取;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号