首页> 中国专利> 在生成对抗中获得更好的语音翻译模型的训练方法和系统

在生成对抗中获得更好的语音翻译模型的训练方法和系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种在生成对抗中获得更好的语音翻译模型的训练方法和系统。该方法包括收集训练数据，利用训练数据中的转录‑翻译数据对训练MT模型；利用收缩机制对ST模型的输入长度进行压缩，使得语音和文本的编码层输出长度近似相同，包括：先采用CTC损失帮助ST模型预测语音的转录，捕捉语音的声学信息；然后利用CTC存在的峰值现象去除ST模型编码层状态中的冗余信息；采用对抗器通过“最大最小”的方法，使ST模型的编码层输出分布拟合MT模型的编码层输出分布，帮助ST模型捕捉到更多的语义信息；以CTC损失作为附加损失，结合端到端ST模型的损失对整个语音翻译模型进行联合训练。本发明能提升语音翻译模型的识别性能，进而提高语音翻译效率和质量。

著录项

公开/公告号CN113505611B

专利类型发明专利
公开/公告日2022-04-15

原文格式PDF
申请/专利权人中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院;
展开▼

申请/专利号CN202110780410.2
发明设计人屈丹;张昊;杨绪魁;闫红刚;张文林;郝朝龙;魏雪娟;李真;
展开▼

申请日2021-07-09
分类号G06F40/58;G06F40/30;G10L15/26;G06K9/62;G06N3/04;G06N3/08;
代理机构郑州大通专利商标代理有限公司;
代理人张立强
地址 450000 河南省郑州市高新区科学大道62号
入库时间 2022-08-23 13:27:45

法律信息

法律状态公告日

法律状态信息

法律状态
2022-04-15

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 在生成对抗中获得更好的语音翻译模型的训练方法和系统 [P] . 中国专利： CN113505611A . 2021-10-15
2. 基于模型增强的语音翻译模型训练方法、系统及语音翻译方法和设备 [P] . 中国专利： CN113505610B . 2022.05.06
3. 在虚拟场景中组合模型的方法、系统、设备和介质 [P] . 世界知识产权组织专利： WO2020/143250A1 . 2020.07.16