首页> 中国专利> 训练词权重模型及提取核心词的方法、装置、设备和介质

训练词权重模型及提取核心词的方法、装置、设备和介质

摘要

本申请涉及计算机技术领域,尤其涉及训练词权重模型及提取核心词的方法、装置、设备和介质,用以提高核心词提取的准确率。方法包括:从多媒体内容中获取训练样本数据集;根据训练样本数据集对未训练的词权重模型执行多轮迭代训练,以获得已训练的词权重模型;每轮迭代训练过程为:从训练样本数据集中选取训练样本,将训练样本包含的样本文本和正负核心词语对输入未训练的词权重模型,获得各正核心词作为样本文本的核心词的第一概率值,各负核心词作为样本文本的核心词的第二概率值;根据第一概率值,第二概率值和标签间的差异,调整未训练的词权重模型的网络参数。本申请基于正负核心词语对对词权重模型进行训练,有利于提高核心词提取的准确率。

著录项

  • 公开/公告号CN113392651A

    专利类型发明专利

  • 公开/公告日2021-09-14

    原文格式PDF

  • 申请/专利权人 腾讯科技(深圳)有限公司;

    申请/专利号CN202011238206.X

  • 发明设计人 黄剑辉;

    申请日2020-11-09

  • 分类号G06F40/30(20200101);G06F40/211(20200101);G06F40/289(20200101);G06N3/08(20060101);G06N3/04(20060101);

  • 代理机构11291 北京同达信恒知识产权代理有限公司;

  • 代理人李娟

  • 地址 518044 广东省深圳市南山区高新区科技中一路腾讯大厦35层

  • 入库时间 2023-06-19 12:35:33

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-14

    实质审查的生效 IPC(主分类):G06F40/30 专利申请号:202011238206X 申请日:20201109

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号