首页> 中文学位 >基于加速近端梯度法和文本语义的垃圾评论信息分类方法
【6h】

基于加速近端梯度法和文本语义的垃圾评论信息分类方法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1选题背景及意义

1.2国内外研究现状

1.3本文主要工作与创新

1.4本文组织结构

第二章 垃圾评论检测技术概要

2.1垃圾评论知识介绍

2.2欺骗性的评论检测技术

2.3其他评论信息检测技术

2.4本章小结

第三章 基于加速近端梯度法的垃圾评论检测方法

3.1加速近端梯度法简介

3.2基于加速近端梯度法的检测模型

3.3实验设计

3.4本章小结

第四章 基于文本语义的垃圾评论检测方法

4.1引言

4.2文本相似度介绍

4.3垃圾评论系统的设计

4.4朴素贝叶斯分类器

4.5实验结果

4.6本章小结

第五章 总结与展望

5.1总结

5.2展望

参考文献

附录2 攻读硕士学位期间撰写的论文

附录3 攻读硕士学位期间申请的专利

致谢

展开▼

摘要

随着Web2.0的蓬勃发展,许多消费者养成在网上购物的习惯。一些用户针对一些感兴趣的产品会发表评论,在这些评论中故意的叫好或贬低某些产品,这些评论称之为垃圾评论,客户如果阅读了这些价值受到混淆的评论,就容易受到误导,从而做出错误的判断。如何识别出有效信息,从审查的评论中找到垃圾评论并删除,本文分别从评论者和评论文本两个角度,分类出垃圾评论信息,留下真实的产品评论。
  首先,本文提出了一种基于加速近端梯度法的垃圾评论发送者的分类方法。因为垃圾评论者的评论留言是垃圾评论,根据垃圾评论者留下的评论,就能够很容易识别出垃圾评论信息。本文总结了垃圾评论者的行为目的,例如用户评分偏差行为模式,本文以此为垃圾评论者的分类准则。本文从Amazon网站获取800条记录,以不同的评论者对不同的商品的评分构成一个二维矩阵,通过加速近端梯度法找出偏差评分,从而找到最有可能的垃圾评论者,找出他们发布的评论信息,为进一步检测做铺垫。和传统的基于评分的检测方法相比,能更准确的找出潜在的垃圾评论发送者。
  一般的检测手段就到此结束,判断他们发布的信息为垃圾评论,但这个有局限性而且不太准确,根据评分发现的评论者不可能百分之百的就是垃圾评论者,因此,本文又增加了一个基于文本语义的垃圾评论检测系统,相比传统的检测系统,只是根据文本的相似性来判断是否是垃圾评论,本文在基于文本相似度的基础上增加了基于评论和商品的关联程度以及单个词语的评论内容检测方法,而且还考虑买入时间、评论时间、用户等级、用户评分等因素,经过实验的验证,本文提出的方法比传统的基于文本相似度的检测方法更好的识别出垃圾评论信息。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号