首页> 中国专利> 文章主题挖掘方法和装置及计算机可读存储介质

文章主题挖掘方法和装置及计算机可读存储介质

摘要

本公开公开了一种文章主题挖掘方法和装置及计算机可读存储介质,涉及计算机领域。其中的方法包括:将检测集中待检测的文章表示为文章向量;将文章向量输入聚类机器学习模型得到所述文章的主题概率分布;根据所述文章的主题概率分布,在最大概率与第二大概率之间的差距小于预设阈值的情况下,根据最大概率的主题和第二大概率的主题形成所述文章的复合主题。本公开基于聚类机器学习模型实现了一种自动挖掘文章主题的方案,可以减少人为因素的影响,提高文章主题挖掘地准确性,同时,对于主题不鲜明的文章,形成其复合主题,使得文章主题更具代表性。

著录项

  • 公开/公告号CN110019805A

    专利类型发明专利

  • 公开/公告日2019-07-16

    原文格式PDF

  • 申请/专利号CN201711363739.9

  • 发明设计人 王颖帅;李晓霞;苗诗雨;

    申请日2017-12-18

  • 分类号G06F16/35(20190101);G06F17/27(20060101);G06N20/00(20190101);

  • 代理机构11038 中国国际贸易促进委员会专利商标事务所;

  • 代理人许蓓

  • 地址 100195 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层

  • 入库时间 2024-02-19 11:37:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-09

    实质审查的生效 IPC(主分类):G06F16/35 申请日:20171218

    实质审查的生效

  • 2019-07-16

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号