首页> 中国专利> 低资源多语言的语音识别模型、语音识别方法

低资源多语言的语音识别模型、语音识别方法

页面导航

摘要
著录项
相似文献

摘要

本发明属于语音识别领域，具体涉及一种低资源多语言的语音识别模型、语音识别方法，旨在为了解决多语言混用状态下小语种语言识别准确度低的问题。本发明语音识别模型为端到端的语音识别模型，该模型中子词词表为多语言子词词表，所述多语言子词词表为设定低资源语种的标注文本与设定高资源语种的标注文本合并起来采用BPE算法共同生成多语言的符号词表；所述语音识别模型的训练数据为设定低资源语种的伪标注训练数据和设定高资源语种的训练数据的合并数据。本发明提高了包含小语种的多语种语音信息识别的准确度。

著录项

公开/公告号CN110428818B

专利类型发明专利
公开/公告日2021-09-28

原文格式PDF
申请/专利权人中国科学院自动化研究所;
展开▼

申请/专利号CN201910732557.7
发明设计人周世玉;徐波;
展开▼

申请日2019-08-09
分类号G10L15/06(20130101);G10L15/02(20060101);G10L15/08(20060101);G10L15/14(20060101);
代理机构11576 北京市恒有知识产权代理事务所(普通合伙);
代理人郭文浩;尹文会
地址 100190 北京市海淀区中关村东路95号
入库时间 2022-08-23 12:33:11

相似文献

专利
中文文献
外文文献

1. 低资源多语言的语音识别模型、语音识别方法 [P] . 中国专利： CN110428818B . 2021.09.28
2. 基于BN-SGMM-HMM低资源语音识别方法 [P] . 中国专利： CN113421555A . 2021-09-21
3. SPEECH RECOGNITION MODEL GENERATION DEVICE, METHOD FOR GENERATING SPEECH RECOGNITION MODEL, SPEECH RECOGNITION DEVICE, SPEECH RECOGNITION METHOD, SPEECH RECOGNITION SYSTEM AND RECORDING MEDIUM [P] . 日本专利： JP2002278590A . 2002-09-27

机译：语音识别模型生成装置，语音识别模型的生成方法，语音识别装置，语音识别方法，语音识别系统和记录介质
4. Speech recognition model construction method, speech recognition method, computer system, speech recognition apparatus, program, and recording medium [P] . 美国专利： US9812122B2 . 2017-11-07

机译：语音识别模型的构建方法，语音识别方法，计算机系统，语音识别装置，程序和记录介质
5. Method for constructing a speech recognition model, the speech recognition method, a computer system, a voice recognition device, a program and a recording medium [P] . 日本专利： JP6052814B2 . 2016-12-27

机译：构造语音识别模型的方法，语音识别方法，计算机系统，语音识别装置，程序和记录介质