基于加速近端梯度法和文本语义的垃圾评论信息分类方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着Web2.0的蓬勃发展，许多消费者养成在网上购物的习惯。一些用户针对一些感兴趣的产品会发表评论，在这些评论中故意的叫好或贬低某些产品，这些评论称之为垃圾评论，客户如果阅读了这些价值受到混淆的评论，就容易受到误导，从而做出错误的判断。如何识别出有效信息，从审查的评论中找到垃圾评论并删除，本文分别从评论者和评论文本两个角度，分类出垃圾评论信息，留下真实的产品评论。
　　首先，本文提出了一种基于加速近端梯度法的垃圾评论发送者的分类方法。因为垃圾评论者的评论留言是垃圾评论，根据垃圾评论者留下的评论，就能够很容易识别出垃圾评论信息。本文总结了垃圾评论者的行为目的，例如用户评分偏差行为模式，本文以此为垃圾评论者的分类准则。本文从Amazon网站获取800条记录，以不同的评论者对不同的商品的评分构成一个二维矩阵，通过加速近端梯度法找出偏差评分，从而找到最有可能的垃圾评论者，找出他们发布的评论信息，为进一步检测做铺垫。和传统的基于评分的检测方法相比，能更准确的找出潜在的垃圾评论发送者。
　　一般的检测手段就到此结束，判断他们发布的信息为垃圾评论，但这个有局限性而且不太准确，根据评分发现的评论者不可能百分之百的就是垃圾评论者，因此，本文又增加了一个基于文本语义的垃圾评论检测系统，相比传统的检测系统，只是根据文本的相似性来判断是否是垃圾评论，本文在基于文本相似度的基础上增加了基于评论和商品的关联程度以及单个词语的评论内容检测方法，而且还考虑买入时间、评论时间、用户等级、用户评分等因素，经过实验的验证，本文提出的方法比传统的基于文本相似度的检测方法更好的识别出垃圾评论信息。

著录项

作者
徐胜国;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科计算机技术
授予学位硕士
导师姓名张卫丰;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;
关键词
垃圾评论; 信息分类; 文本语义; 加速近端梯度; 相似度检测;

相似文献

中文文献
外文文献
专利

1. 一种基于加速近端梯度法的视频散列算法研究 [J] . 轩璐 . 电视技术 . 2014,第023期
2. 基于转发评论的微博语义扩充和分类方法 [J] . 刘磊 ,许志刚 ,蔡海博 . 北京工业大学学报 . 2015,第010期
3. 一种基于语义距离的Web评论SVM情感分类方法 [J] . 肖正 ,刘辉 ,李兵 . 计算机科学 . 2014,第009期
4. 融合词语统计特征和语义信息的文本分类方法研究 [J] . 张丽 ,马静 . 计算机工程与科学 . 2021,第007期
5. 一种基于LDA主题模型的评论文本情感分类方法 [J] . 王伟 ,周咏梅 ,阳爱民 . 数据采集与处理 . 2017,第003期
6. 一种基于语义概念的中文文本分类方法 [C] . 陈伟萍 ,王琳 ,封化民 . 第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议（第一届全国和谐人机环境联合学术大会） . 2005
7. 语义分类方法在淘宝评论文本中应用研究 [A] . 高彦 . 2015

基于加速近端梯度法和文本语义的垃圾评论信息分类方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅