首页> 外文期刊>日本音響学会誌/The Journal of the Acoustical Society of Japan >End-to-End音声処理の概要とESPnet2を用いたその実践
【24h】

End-to-End音声処理の概要とESPnet2を用いたその実践

机译:端到端语音处理概述和ESPNET2练习

获取原文
获取原文并翻译 | 示例
       

摘要

深層学習の発展に伴い,音声処理の分野でも,すベての処理をニューラルネットワークのみで完結させるEnd-to-End(E2E)アプローチが有力な選択肢のーつとなりつつある。音声認識(ASR)の分野では,大規模コーパスを利用したベンチマークにおいて,従来のニューラルネットワークと隠れマルコフモデル(HMM)のハイブリッドシステム(DNN-HMM)を上回る性能が報告されている。テキスト音声合成(TTS)の分野でも,WaveNetに代表されるニューラルボコーダを活用することで,人間の発話と同等の品質の読み上げ音声の生成が実現されている。更に驚くべきことに,計算機能力の向上やモデルの改良により,スマートフォンなどの小型デバィス上でのE2E音声処理モデルの利用が実用化しつつある。
机译:随着深度学习的发展,完成了仅在语音处理领域内建造的内部内部(E2E)方法正在成为一个强大的选项。在语音识别(ASR)领域中,使用大规模语料的基准在基准中报告了具有传统神经网络的性能和隐藏的Markov模型(HMM)的混合系统(DNN-HMM)。在文本语音合成(TTS)领域中,我们利用了Wavenet表示的神经探测器,并且实现了对人类语音等同的质量的读音语音的产生。令人惊讶的是,通过提高计算机能力和模型的改进来实践在诸如智能手机的小型设备上使用E2E语音处理模型。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号