首页> 中国专利> 一种基于块的自注意力实时端到端语音翻译方法

一种基于块的自注意力实时端到端语音翻译方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开一种基于块的自注意力实时端到端语音翻译方法，步骤为：预处理录制好的音频文件训练数据，将每条语音的ID及其存储的路径和对应的目标语文本进行映射，构建两个映射文件；分别提取音频的梅尔滤波器组和梅尔频率倒谱系数两种声学特征；利用训练数据构建目标语词典，用于解码时生成目标语文本序列；对训练数据进行清洗，并转换为端到端语音翻译模型需要的格式文件；初始化端到端语音翻译模型，用特定格式的数据文件进行训练；在推断阶段，设置块的大小，使用训练完成的端到端语音翻译模型对源语音进行动态编码，实现实时生成目标语句子。本发明使模型具备实时进行语音翻译的能力，在模型性能没有下降的情况下，提高了模型的解码速度。

著录项

公开/公告号CN114141231A

专利类型发明专利
公开/公告日2022-03-04

原文格式PDF
申请/专利权人沈阳雅译网络技术有限公司;
展开▼

申请/专利号CN202111359836.7
发明设计人徐萍;宁义明;
展开▼

申请日2021-11-17
分类号G10L15/02(20060101);G10L15/06(20130101);G10L15/26(20060101);G10L25/24(20130101);
代理机构21117 沈阳新科知识产权代理事务所(特殊普通合伙);
代理人李晓光
地址 110004 辽宁省沈阳市和平区三好街78号东软电脑城C座11层
入库时间 2023-06-19 14:23:39

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-04

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种基于块的自注意力实时端到端语音翻译方法 [P] . 中国专利： CN114141231A . 2022-03-04
2. 一种基于残差高斯自注意力的Transformer端到端语音识别方法 [P] . 中国专利： CN113241075A . 2021-08-10
3. TOKEN-WISE TRAINING FOR ATTENTION BASED END-TO-END SPEECH RECOGNITION [P] . US2021264901A1 . 2021-08-26

机译：基于端到端语音识别的注意力令牌培训
4. Token-wise training for attention based end-to-end speech recognition [P] . US11037547B2 . 2021-06-15

机译：基于端到端语音识别的注意力令牌培训
5. TOKEN-WISE TRAINING FOR ATTENTION BASED END-TO-END SPEECH RECOGNITION [P] . 美国专利： US2020265830A1 . 2020-08-20

机译：基于注意力的端到端语音识别的令牌明智培训