首页> 外文期刊>電子情報通信学会技術研究報告 >音声認識のための複数の認識器を利用した能動学習
【24h】

音声認識のための複数の認識器を利用した能動学習

机译:使用多个识别器进行语音识别的主动学习

获取原文
获取原文并翻译 | 示例
       

摘要

We propose an active learning method with multiple recognizers for large vocabulary continuous speech recognition. In this approach, the recognition results obtained from recognizers are used for selecting utterances. Here, a progressive search method is used for aligning sentences, and voting entropy is used as a measure for selecting utterances. Our method was evaluated by using 190-hour speech data in the Corpus of Spontaneous Japanese. It proved to be significantly better than random selection. It only required 60 h of data to achieve a word accuracy of 74%, while standard training (i.e., random selection) required 97 h of data. The recognition accuracy of our proposed method was also better than that of the conventional uncertainty sampling method using word posterior probabilities as the confidence measures for selecting sentences.%大語彙連続苦声認識器の学習データに対する書き起こしコスト削減のための複数の認識器を利用した能動学習手法を提案する.この手法では複数の認識器から得られた複数の異なる認識結果文を用いて発話の選択を行う.認識結果文をアラインメン卜するためのプログレッシブ法とVoting Entropyを発話選択に用いている.提案手法を日本語話し言葉コーパスの190時間の音声データを使い評価し,能動学習を行わないランダムな発話選択より顕著に良い結果を得た.74%の単語正解精度を得るために必要な書き起こし付きデータ量はランダム選択では97時間,単語事後確率を用いた従来手法では72時間であるが,提案手法では60時間で済むという結果になった.
机译:我们提出了一种具有多个识别器的主动学习方法,用于大词汇量连续语音识别。在这种方法中,将从识别器获得的识别结果用于选择话语。在此,将逐行搜索方法用于对齐句子,并且将投票熵用作选择话语的量度。我们的方法是通过使用自发日语语料库中的190小时语音数据进行评估的。事实证明,它比随机选择要好得多。只需60小时的数据即可达到74%的单词准确度,而标准训练(即随机选择)则需要97小时的数据。我们提出的方法的识别精度也比传统的以单词后验概率作为选择句子的置信度的不确定性抽样方法要好。%大语汇连続苦声认识器の学习データに対する书き起こしコスト切のための复数认识结果文をアラインメン卜するためのプログレッシブ法と投票熵を発话选択に用いている。逐步手法を日本语话し言葉コーパスの190时间の音声データを使い评価し,能动学习を行わないランダムな発话选択より顕着に良い结果を得た.74%の时间语正解精度を得るために必要るために书き起こし付きデータ量はランダム选択では97时间,単语事后确率を用いた従来手法では72时间であるが,便于手法では60时间で済むという结果になった。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号