首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声認識のための複数の認識器を利用した能動学習
【24h】

音声認識のための複数の認識器を利用した能動学習

机译:使用多个识别器进行语音识别的主动学习

获取原文
获取原文并翻译 | 示例
           

摘要

大語彙連続音声認識器の学習データに対する書き起こしコスト削減のための複数の認識器を利用した能動学習手法を提案する.この手法では複数の認識器から得られた複数の異なる認識結果文を用いて発話の選択を行う.認識結果文をアラインメントするためのプログレッシブ法とVoting Entropyを発話選択に用いている.提案手法を日本語話し言葉コーパスの190時間の音声データを使い評価し,能動学習を行わないランダムな発話選択より顕著に良い結果を得た.74%の単語正解精度を得るために必要な書き起こし付きデータ量はランダム選択では97時間,単語事後確率を用いた従来手法では72時間であるが,提案手法では60時間で済むという結果になった.
机译:我们提出一种使用多个识别器的主动学习方法,以减少转录大型词汇连续语音识别器的学习数据的成本。在该方法中,使用从多个识别器获得的多个不同的识别结果语句来选择语音。将识别结果语句和投票熵对齐的渐进方法用于语音选择。使用来自日语口语语料库的190个小时的音频数据对提出的方法进行了评估,与没有进行主动学习的随机语音选择相比,获得的结果明显更好。获得74%正确单词准确性所需的转录数据量对于随机选择是97小时,对于使用后单词概率的常规方法是72小时,而对于建议的方法是60小时。它是。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号