首页> 中国专利> 基于文本聚类的信息提取方法、装置及可读存储介质

基于文本聚类的信息提取方法、装置及可读存储介质

摘要

本发明公开了一种基于文本聚类的信息提取方法、装置以及可读存储介质,本发明将待处理的商品评论信息作为待处理样文本,并设定好频繁词筛选权重值,按照频繁词筛选权重值对待处理样本文本进行文本预处理、文本聚类以及样本数据剪枝这三个阶段的处理,进而能够提高待处理的商品评论信息的文本聚类精度,在面对复杂繁多的商品评论信息量时得到更加精确、更有价值的信息,能够解决目前传统的文本聚类法在面对存在的文本长尾现象无法有效进行文本聚类的问题,对于在解决文本长尾现象聚类的问题中起到了很好的作用,提高了聚类的精确度。

著录项

  • 公开/公告号CN108959453B

    专利类型发明专利

  • 公开/公告日2021-08-27

    原文格式PDF

  • 申请/专利权人 中南民族大学;

    申请/专利号CN201810618205.4

  • 申请日2018-06-14

  • 分类号G06F16/35(20190101);G06F40/289(20200101);G06F40/216(20200101);

  • 代理机构44287 深圳市世纪恒程知识产权代理事务所;

  • 代理人胡海国

  • 地址 430074 湖北省武汉市洪山区民族大道182号中南民族大学

  • 入库时间 2022-08-23 12:23:09

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号