首页> 中国专利> 基于多任务模型的语音识别与关键词检测装置和方法

基于多任务模型的语音识别与关键词检测装置和方法

摘要

本发明公开了一种基于多任务模型的语音识别与关键词检测装置,包括:神经网络;语音识别解码器,关键词解码器,训练模块;在训练阶段,训练模块采用第一输入音频数据、第一文本标签以及第一CTC损失函数对语音识别解码器和神经网络进行训练,采用所述第一输入音频数据、第二文本标签以及第二CTC损失函数对关键词解码器和神经网络进行训练,在训练过程中,根据对应的CTC损失函数的输出进行反向传播实现对神经网络、语音识别解码器和关键词解码器的训练。本发明还公开了一种基于多任务模型的语音识别与关键词检测方法。本发明能有效的利用语音识别的训练数据同时训练模型的关键词检测能力,从而显著提升关键词检测的准确率和召回率。

著录项

  • 公开/公告号CN110648659B

    专利类型发明专利

  • 公开/公告日2022-07-01

    原文格式PDF

  • 申请/专利权人 上海依图信息技术有限公司;

    申请/专利号CN201910906552.1

  • 发明设计人 赖家豪;郑达;李索恒;张志齐;

    申请日2019-09-24

  • 分类号G10L15/06;G10L15/16;G10L15/22;G10L15/26;

  • 代理机构上海市汇业律师事务所;

  • 代理人唐嘉伟

  • 地址 200126 上海市浦东新区耀华路488号1901E室

  • 入库时间 2022-08-23 13:57:03

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号