面向产品评论的垃圾评论识别方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，随着因特网的快速发展，人们发表观点以及相互交流的方式也发生了改变。在产品评论领域，人们越来越喜欢在购物网站上发表自己对产品所持有的观点。这些由用户发表的观点中包含着丰富的有用的信息。同时，在这些观点中也充斥着一些无用的、不真实的垃圾信息。这些垃圾信息的存在影响了产品评论挖掘的质量。
　　本文面向中文产品评论领域，对垃圾评论识别进行了研究，主要工作如下：
　　首先，通过对中文产品评论领域的垃圾评论进行分析，将垃圾评论分成无用评论和不真实评论两大类别，并根据其特点的不同，提出了不同的识别方法。
　　针对无用评论的识别，将其看成是二元分类问题。使用产品特征词、对非产品信息评价语句、问句以及超链接4个重要的分类特征，同时又结合信息增益方法自动抽取出一部分特征来共同表示评论文本。最后由这些特征构成的特征值将评论文本向量化，再采用基于Logistic回归的分类方法将评论文本分为正常评论和无用评论两大类来完成对无用评论的识别。
　　针对不真实评论的识别，考虑了词与词之间的次序问题，并采用2-gram模型来表示评论文本。在构建语言模型的同时，为了避免出现概率值为零的情况，采用Katz平滑方法对模型进行平滑，最后计算每对语言模型的KL散度，如果其值小于某一给定的阈值，则认为是不真实的评论。
　　实验结果表明，本文提出的方法能够有效地识别产品评论中存在的无用评论和不真实评论。

著录项

作者
刘立佳;
展开▼
作者单位

河北大学;

展开▼
授予单位河北大学;
学科计算机应用技术
授予学位硕士
导师姓名袁方;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;
关键词
产品评论; 垃圾信息识别; Logistic回归; Katz平滑方法;
入库时间 2022-08-17 10:28:23

相似文献

中文文献
外文文献
专利

1. 互联网产品评论信息中垃圾评论的识别方法浅析 [J] . 许少岩 ,钟敏娟 . 科技广场 . 2014,第002期
2. 面向产品评论识别的研究 [J] . 武雅萱 ,王悦欣 ,李洋 . 科教文汇 . 2017,第017期
3. 在线产品评论有用性识别方法研究 [J] . 单晓红 ,张晓月 ,刘晓燕 . 北京工业大学学报（社会科学版） . 2018,第005期
4. 面向中文产品评论的完整评价对象抽取方法 [J] . 杨凤芹 ,宋美佳 ,孙铁利 . 计算机工程 . 2017,第006期
5. 一种面向中文产品评论数据的情感分类模型 [J] . 李洋 ,马健新 . 滨州学院学报 . 2016,第006期
6. 基于在线农产品评论的消费者情感标签抽取方法研究 [C] . BAI Lifei ,白梨霏 ,LI Kaiming . 信息系统协会中国分会第七届学术年会 . 2017
7. 面向博客的垃圾评论识别方法研究 [A] . 邓冰娜 . 2011

面向产品评论的垃圾评论识别方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅