首页> 中国专利> 一种基于主题语义感知的特征关键词提取方法

一种基于主题语义感知的特征关键词提取方法

摘要

本发明公开一种基于主题语义感知的特征关键词提取方法,具体包括如下过程:首先,利用关键词与文档主题之间的语义相关度的量化方法,计算关键词集合中每一个关键词的信息增益得分,并计算文档中每一个关键词的主题频率‑逆主题频率(TF‑ITF)得分;然后,选取信息增益得分最大的前κ个关键词,构成信息增益特征关键词集合;并分别针对每个文档,选取该文档中主题相关度得分最大的前λ个关键词,进而构成全局主题信息特征关键词集合;最终,对全局信息增益特征关键词集合和全局主题信息特征关键词集合进行合并,生成最终的特征关键词集合。本发明综合考虑关键词之间以及关键词和文档之间的主题语义关系,实现表征文档主题语义信息的特征关键词提取。

著录项

  • 公开/公告号CN112100317A

    专利类型发明专利

  • 公开/公告日2020-12-18

    原文格式PDF

  • 申请/专利权人 南京邮电大学;

    申请/专利号CN202011017875.4

  • 申请日2020-09-24

  • 分类号G06F16/31(20190101);G06F40/279(20200101);G06F40/30(20200101);

  • 代理机构32243 南京正联知识产权代理有限公司;

  • 代理人王素琴

  • 地址 210000 江苏省南京市新模范马路66号

  • 入库时间 2023-06-19 09:15:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-14

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号