首页> 中国专利> 一种基于主题词向量和网络结构的主题关键词提取方法

一种基于主题词向量和网络结构的主题关键词提取方法

摘要

本发明公开了一种基于主题词向量和网络结构的主题关键词提取方法,具体涉及从文本中提取关键词技术领域。该基于主题词向量和网络结构的主题关键词提取方法基于LDA主题模型对文本语料进行主题聚类,并获得每个主题中与该主题相关度为top100的100个关键词;利用word2vec将文本语料中的每个词表示为一个词向量,通过计算获得每两个词之间的语义相似度,分别计算出与关键词中的每个关键词在语义上相似度top5的词,关键词和每个关键词在语义上相似度top5的词共同组成新的关键词集合;构建关键词网络,并获得每个集合top 20的词作为该主题的关键词。该方法既能对文档中词频较高的关键词进行提取,又可以有效地发现词频较低但是与主题关系强的关键词。

著录项

  • 公开/公告号CN108052593B

    专利类型发明专利

  • 公开/公告日2020-09-22

    原文格式PDF

  • 申请/专利权人 山东科技大学;

    申请/专利号CN201711315360.0

  • 申请日2017-12-12

  • 分类号G06F16/33(20190101);G06F16/35(20190101);G06K9/62(20060101);

  • 代理机构37252 青岛智地领创专利代理有限公司;

  • 代理人陈海滨

  • 地址 266590 山东省青岛市经济技术开发区前湾港路579号

  • 入库时间 2022-08-23 11:14:29

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号