首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >パレート最適と進化的戦略を用いた高精度大語彙音声認識システム構築の自動化
【24h】

パレート最適と進化的戦略を用いた高精度大語彙音声認識システム構築の自動化

机译:高精度大型词汇语音识别系统施工自动化使用最优和进化策略

获取原文
获取原文并翻译 | 示例
           

摘要

近年Deep Neural Network(DNN)の応用やその他諸技術の進展により音声認識システムの性能が大きく向上している.しかしこれらのシステムは多数の調整パラメタを持ち,実際に高い認識精度を実現するためには専門家による調整が必要となる.調整のための負担は非常に大きく,認識技術の高度化とともにシステムを実現する上での主要なボトルネックとなりつつある.そこで本研究では,進化的戦略を用いて自動的に大語彙音声認識システムを構築する手法を提案する.具体的には,DNNのモデル構造やモデル学習時の学習係数などのメタパラメタを共分散行列適応進化的戦略(CMA-ES)を用いて最適化する.さらに,認識性能だけではなく学習されるモデルのサイズも考慮するため,多目的最適化手法であるパレート最適とCMA-ESを組み合わせた手法(CMA-ES+P)についても検討する.実験では,提案手法を用いることでベースラインと比べて単語誤り率を0.48%削減し.たシステムが自動で得られた.また,ベースラインと同等の認識性能を持つDNNを選択した場合,DNNサイズを59%削減できた.本研究で最適化したメタパラメタはKaldiツールキットで公開されているCSJレシピに組み込まれている.
机译:近年来,由于深神经网络(DNN)和其他技术的进展,由于应用了语音识别系统的性能。然而,这些系统具有大量调整参数,并且需要专家调整以实现高识别准确性。调整负担非常大,正在成为实现识别技术进步的系统的主要瓶颈。因此,在本研究中,我们提出了一种使用进化策略自动构建大型词汇语音识别系统的方法。具体地,使用协方差矩阵自适应进化策略(CMA-ES)优化了模型学习时的DNN模型结构和学习系数的元参数。此外,不仅考虑了识别性能,还考虑了要学习的模型的大小,以及组合宫廷优化方法的方法和组合CMA-ES(CMA-ES + P)的方法。在实验中,与基线相比,使用所提出的方法,单词误差率减少0.48%。系统自动获得。 In addition, when DNN having the same recognition performance as the baseline was selected, the DNN size could be reduced by 59%.本研究中优化的MetaParameter纳入了Kaldi工具包中发布的CSJ配方。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号