...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >DNNによる音素誤りパターン学習に基づく音声中の検索語検出
【24h】

DNNによる音素誤りパターン学習に基づく音声中の検索語検出

机译:基于DNN的音素误差模式学习的音频期间搜索单词检测

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

本稿では,Deep Neural Network(DNN)を使用して,複数の音声認識システムから得られた音素系列から正解音素を推定し,この結果を音声中の検索語検出(STD)に適用する方法を提案する.音素推定(認識)は,音声の音響特徴量を入力として隠れマルコフモデル(HMM)の音素に対応する各状態の出力確率をDNNを用いて推定する方法が一般的であるが,本手法では,DNNに複数の音声認識システムの出力パターンを学習させることで,正しい音素を予測する.従来のガウス混合分布に基づくHMMを音響モデルとして用いた音声認識システムから最新のDNN-HMMに基づいた音声認識システムの出力結果に対して提案手法を適用できることから,音声認識性能を更に改善することが可能である.提案手法をSTDタスクに適用した.実験の結果,我々が提案している条件付き確率場(CRF)の性能を大きく改善することができた.
机译:在本文中,我们使用深神经网络(DNN)来估计从多个语音识别系统获得的音素序列的正确答案,并提出一种方法来应用该结果以在音频执行中搜索术语检测(STD)。声子估计(识别)通常是使用DNN,但是在该方法中估计与隐藏声学特征量的音素对应于隐藏声学特征量的音素的输出概率,而是通过学习多个语音的输出模式预测DNN中的识别系统,预测正确的音素。通过基于传统的高斯混合分布作为声学模型,可以使用HMM的语音识别系统从语音识别系统的进一步提高语音识别性能。该方法应用于STD任务。作为实验的结果,我们能够显着提高我们提出的条件概率场(CRF)的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号