首页> 中国专利> 一种专利技术关键词非监督提取方法

一种专利技术关键词非监督提取方法

摘要

本发明公开了一种专利技术关键词非监督提取方法,包括步骤100:对专利文本预处理,以提取专利文本描述的技术相关信息的关键词,并通过句法分析对关键词进行相互依存关系分析;步骤200:对关键词及其相互依存关系进行分析和隐藏特征提取,并将多维的隐藏特征压缩至1D权重数值信息,并对1D权重数值信息进行重要程度的表征和排序;步骤300:通过通用词表对表征排序后的所述1D权重数值信息进行过滤以得到候选关键词集合。通过构建语法分析树识别专利文本关键词,通过引入句法依存关系并制定词性和依存关系规则以构建词图;再基于词图构建出图结构的卷积神经网络,进行关键词隐藏特征提取、关键词权重排序,以完成关键词的高效提取。

著录项

  • 公开/公告号CN112818661B

    专利类型发明专利

  • 公开/公告日2021-10-08

    原文格式PDF

  • 申请/专利权人 中国科学院科技战略咨询研究院;

    申请/专利号CN202110116540.6

  • 发明设计人 潘璇;朱涛;刘潇;

    申请日2021-01-28

  • 分类号G06F40/211(20200101);G06F40/247(20200101);G06F40/289(20200101);G06N3/04(20060101);G06Q50/18(20120101);

  • 代理机构11390 北京和信华成知识产权代理事务所(普通合伙);

  • 代理人胡剑辉

  • 地址 100083 北京市海淀区中关村东路55号主楼1101室

  • 入库时间 2022-08-23 12:35:00

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号