首页> 外文会议>日本音響学会研究発表会 >後向きLSTM言語モデルとアンサンブル符号化器を用いたNベストリスコアリングのための一対仮説比較モデルの改良
【24h】

後向きLSTM言語モデルとアンサンブル符号化器を用いたNベストリスコアリングのための一対仮説比較モデルの改良

机译:使用后面的LSTM语言模型和集合编码器改进N最佳TRIS涂层的一对假设比较模型

获取原文

摘要

ニューラルネットワーク(neural network: NN) の導入により音声認識の精度は飛躍的に向上したものの,雑音環境下での音声認識や自然発話に対する音声認識においては,その精度は依然として満足できるものではない.これらの状況下において認識精度を向上させる手法として,音声認識仮説のN ベストリスコアリングが行われている.現在,N ベストリスコアリングで用いられるモデルとしては,recurrent NN (RNN) に基づく言語モデル(language model: LM) が広く用いられている.その中でも,long short-term memory (LSTM) に基づくLM (LSTMLM) が,特に高い精度を示すモデルとして用いられている[3].しかし,RNNLM は本来,過去の単語列から現在の単語の生起確率を予測するためのモデルであり,N ベストリスコアリングを行うために考案されたモデルではない.
机译:神经网络(神经网络:NN)语音识别的准确性通过介绍显着改善噪声环境中的语音识别和自然语音的声音在语音识别中,其准确性仍然令人满意它不是。在这种情况下识别准确性作为改善语音识别假设的方法最好正在进行灰鼠。目前,模型用于N-Best Ress Coring基于反复间NN的语言模型(RNN)(语言模型:LM)被广泛使用。那最重要的是,基于长期短期记忆(LSTM)LM(LSTMLM)是一种显示特别高精度的型号使用。[3]。但是,RNNLM原本预测来自最后一个单词字符串的当前单词的发生概率进行最佳危险这不是一个设计的模型。

著录项

相似文献

  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号