首页> 中文期刊> 《计算机工程 》 >融合时间序列与多尺度特征的虚假评论识别方法

融合时间序列与多尺度特征的虚假评论识别方法

             

摘要

结合时间序列与多尺度特征, 提出一种改进的虚假评论识别方法.考虑时间因素对评分及其分布的影响, 构建基于多维时间序列的虚假评论识别模型提取异常评论特征, 并对异常评论特征进行层次划分, 根据多尺度特征思想获取基准尺度特征及细分尺度特征.采用基于密度峰值的聚类算法识别虚假评论, 并提高虚假评论识别模型的抗噪能力.实验结果表明, 与基于基准尺度特征和多尺度特征的密度峰值聚类虚假评论识别方法相比, 该方法的AUC值达到92%, 虚假评论识别正确率更高.%This paper proposes an improved fake reviews identification method combining time series with multi-scale features.Considering the influence of time factors on the ratings and its distribution, it constructs fake reviews identification model based on multi-dimensional time series to extract abnormal features.It divides abnormal review features into groups, benchmark features and subdivision scale features are extracted according to multi-scale feature idea.To improve the noise immunity of false reviews identification models, it uses a clustering algorithm based on density peaks to identify fake views.Experimental results show that this method has higher identification correct rate of fake reviews and AUC value reach 92% compared with false comment identification method through density peaks clustering based on benchmark scale feature and multi-scale feature.

著录项

  • 来源
    《计算机工程 》 |2019年第3期|278-285292|共9页
  • 作者

    狄瑞彤; 王红; 房有丽;

  • 作者单位

    山东师范大学 信息科学与工程学院;

    济南 250358;

    山东省分布式计算机软件新技术重点实验室;

    济南 250014;

    山东师范大学 信息科学与工程学院;

    济南 250358;

    山东师范大学 生命科学学院;

    济南 250358;

    山东省分布式计算机软件新技术重点实验室;

    济南 250014;

    山东师范大学 信息科学与工程学院;

    济南 250358;

    山东师范大学 生命科学学院;

    济南 250358;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程 ;
  • 关键词

    虚假评论; 时间序列 ; 多尺度 ; 主成分分析; 聚类 ;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号