一种RNN-T与BERT相结合的端到端语音识别模型

郭家兴; 韩纪庆

首页> 中文期刊> 《智能计算机与应用》 >一种RNN-T与BERT相结合的端到端语音识别模型

一种RNN-T与BERT相结合的端到端语音识别模型

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

端到端语音识别模型由于结构简单且容易训练,已成为目前最流行的语音识别模型.然而端到端语音识别模型通常需要大量的语音-文本对进行训练,才能取得较好的识别性能.而在实际应用中收集大量配对数据既费力又昂贵,因此其无法在实际应用中被广泛使用.本文提出一种将RNN-T(Recurrent Neural Network Transducer,RNN-T)模型与BERT(Bidirectional Encoder Representations from Transformers,BERT)模型进行结合的方法来解决上述问题,其通过用BERT模型替换RNN-T中的预测网络部分,并对整个网络进行微调,从而使RNN-T模型能有效利用B ERT模型中的语言学知识,进而提高模型的识别性能.在中文普通话数据集AISHELL-1上的实验结果表明,采用所提出的方法训练后的模型与基线模型相比能获得更好的识别结果.

著录项

来源
《智能计算机与应用》 |2021年第2期|169-173|共5页
作者
郭家兴; 韩纪庆;
展开▼
作者单位

哈尔滨工业大学计算机科学与技术学院哈尔滨150001;

哈尔滨工业大学计算机科学与技术学院哈尔滨150001;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络与计算;
关键词
语音识别; 端到端模型; BERT模型;

相似文献

中文文献
外文文献
专利

1. 一种RNN-T与BERT相结合的端到端语音识别模型 [J] . 郭家兴 ,韩纪庆 . 智能计算机与应用 . 2021,第002期
2. 一种基于路由集的VoLTE端到端语音质量问题分段定界定位方法的实现 [J] . 郑银云 . 电信工程技术与标准化 . 2021,第008期
3. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
4. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
5. 一种基于卷积神经网络的端到端语音分离方法 [J] . 范存航 ,刘斌 ,陶建华 . 信号处理 . 2019,第004期
6. 神经高位端端与低位端侧或侧侧吻合相结合提高神经修复能力的实验研究 [C] . 许娅莉 ,邵新中 . 河北省第四届手外科学术会议 . 2005
7. 基于文本数据的端到端语音识别模型训练数据扩充方法 [A] . 郭家兴 . 2020

一种RNN-T与BERT相结合的端到端语音识别模型

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅