首页> 中国专利> 提取文本关键词的方法、设备和计算机可读存储介质

提取文本关键词的方法、设备和计算机可读存储介质

摘要

本申请涉及自然语言处理领域,提供了一种提取文本关键词的方法、装置、设备和计算机可读存储介质。所述方法包括:通过统计模型,获取目标文本的全局主题词,以得到目标文本的全局主题特征q1;挖掘目标文本的频繁序列模式,以得到目标文本的关键词局部特征q2;提取目标文本的候选关键词,构成候选关键词集;以特征集Q作为贝叶斯模型的输入,根据贝叶斯模型求取条件概率P(A|Q)不小于第一预设阈值时贝叶斯模型从候选关键词集确定的关键词a,将关键词a作为目标文本的关键词。相比于现有技术,本申请提供的技术方案使得在自然语言处理领域得到的目标文本的关键词的精度较高,而应用贝叶斯模型这一经典模型提取关键词,在计算效率上有了提高的可能。

著录项

  • 公开/公告号CN111950261B

    专利类型发明专利

  • 公开/公告日2021-01-26

    原文格式PDF

  • 申请/专利权人 腾讯科技(深圳)有限公司;

    申请/专利号CN202011106218.7

  • 发明设计人 刘志煌;胡林红;李冠灿;罗朝亮;

    申请日2020-10-16

  • 分类号G06F40/216(20200101);G06F40/289(20200101);G06F40/30(20200101);G06K9/62(20060101);

  • 代理机构44300 深圳翼盛智成知识产权事务所(普通合伙);

  • 代理人彭绪坤

  • 地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层

  • 入库时间 2022-08-23 11:30:26

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号