首页> 中文学位 >引入时序关系的虚假评论文本检测
【6h】

引入时序关系的虚假评论文本检测

代理获取

目录

1 引言

1.1 研究背景及意义

1.2 国内外研究现状

1.3 研究内容和文章结构安排

2 相关理论方法和技术

2.1 相关理论方法

2.2 相关技术

2.3 本章小结

3 引入时序关系的虚假评论文本检测模型

3.1 模型框架

3.2 模型详细结构设计

3.3 本章小结

4 实验验证

4.1 数据集

4.2 数据预处理

4.3 模型的训练

4.4 评价指标和实验结果

4.5 分析

4.6 本章小结

5 总结与展望

5.1 本文工作总结

5.2 未来工作展望

参考文献

致谢

展开▼

摘要

越来越多的消费者开始在互联网上进行商品的评分和评论。同时网上购物用户对这些由其他用户生成的商品评价越发依赖,越来越多的人将它们视为自己在网上商城选择商品的重要依据。网上评论对消费者购买意向的影响的逐渐突显使得某些不法商家开始通过伪造网上评分和评论进行非法牟利。这对电子商务的秩序产生了极其恶劣的影响。所以对这些行为进行有效打击成为如今电子商务的当务之急。
  然而现有的针对电子商务领域类似欺诈的研究多集中在对评分等信息的利用上,而较少有研究者专注于从文本和自然语言处理的角度入手。不仅如此,目前的虚假评论文本研究几乎都采用时间不可知论模型,而因此无法捕捉评论文本内的时序关系信息。
  本文首先对当前互联网商品虚假评论检测的研究意义和现状做出进一步的分析,而后对相关理论和技术做出简要的介绍。
  然后,本文在此基础上提出一个新的网络商品虚假评论文本检测模型。该模型的主要设计思想是将评论文本作为时间序列进行对待,从而使模型能够从中获取评论文本中词与词之间的时序关系信息。模型使用一个基于LSTM的循环神经网络对评论文本中隐含的时序关系信息进行提取,同时使用词嵌入技术将评论文本基于词典和独热码的稀疏表示转化为稠密表示。而后神经网络将每一个时刻中隐含层的输出求取平均值,作为评论文本的等长的特征向量表示。最后利用基于支持向量机的二分类器对网络商品评论文本的真实性做出最终判断。
  最后,本文设计并实施了一组实验,并在实验中将所提出的算法与采用基于独热码的评论文本数据表示形式的支持向量机算法进行比较,证明了本文提出算法的优越性,同时证明了向虚假评论文本的自动检测问题中引入对时序信息的考虑可以提高算法的表现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号