首页> 中国专利> 一种中文商品虚假评论数据集自动生成方法

一种中文商品虚假评论数据集自动生成方法

摘要

本发明公开了一种中文商品虚假评论数据集的自动生成方法,包括如下步骤:a)将事先采集到的商品评论数据读入内存;b)利用分词工具对评论进行分词,得到评论文本的词序列表示;c)对给定范围内的商品评论两两之间进行文本相似度的比较,得到商品虚假评论集合Rf1中;d)对Rf1中的评论执行关联查询,得到商品虚假评论结果集R1;e)提取给定范围内商品评论对应的评论人的名称信息;f)对评论人名称进行分析,找出符合一定规律特征的系列评论人名称,对虚假评论人执行关联查询,得到商品虚假评论结果集R2;g)最后,合并R1和R2,得到最终的商品虚假评论数据集。本发明完全自动化检测和识别商品评论数据中的虚假评论,无需人工干预和标注,自动生成商品虚假评论数据集。

著录项

  • 公开/公告号CN109241527A

    专利类型发明专利

  • 公开/公告日2019-01-18

    原文格式PDF

  • 申请/专利权人 浙江工商大学;

    申请/专利号CN201810971800.6

  • 发明设计人 毛郁欣;申屠莹莹;朱平;

    申请日2018-08-24

  • 分类号G06F17/27(20060101);G06F17/22(20060101);G06F16/335(20190101);

  • 代理机构33200 杭州求是专利事务所有限公司;

  • 代理人邱启旺

  • 地址 310018 浙江省杭州市下沙高教园区学正街18号

  • 入库时间 2024-02-19 07:58:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-19

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20180824

    实质审查的生效

  • 2019-01-18

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号