...
首页> 外文期刊>電子情報通信学会論文誌 >マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション
【24h】

マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション

机译:基于贝叶斯信息准则的多音素在线说话人二分法

获取原文
获取原文并翻译 | 示例
           

摘要

本論文では,対談音声認識のための,音素情報そ利用したベイズ情報量基準に基づくオンライン話者ダイアライゼーション手法について述べる.従来のオンライン話者ダイアライゼーションは,対談音声から切り出される一つの音声区間内に多く発生する話者交替点を想定していないものや,話者判定結果をリアルタイム音声認識の話者適応に利用するには,話者判定の遅れ時間が大きく不向きなもぁが多い.提案手法では,ベイズ情報量基準により,複数話者が連続して発話する音声区間内の話者交替点を逐次検出しながら,オンライン性を考慮した判定手法で話者ダイアライゼーションを行う.また,音素認識から得られる音素情報に基づいて特徴量を分類した,「マルチ音素クラス」モデルを用いることで,特に短い遅れ時間での話者ダイアライゼーション精度の向上を図る.報道系情報番組の対談部分を対象とした話者ダイアライゼーション実験を行った結果,遅れ時間2秒の話者判定において,提案手法により,従来の単一音素クラスの全音素モデルに比ベて話者ダイアライゼーション誤りが20.0%削減することを確認した.話者判定結果を利用した音声認識のオンライン話者適応実験では,話者交替点前後の発話に関して7.8%の単語誤り削減率を得た.
机译:在本文中,我们描述了一种基于贝叶斯信息准则,利用音素信息进行会话语音识别的在线说话人二分法,传统的在线说话人二分法是从会话语音中提取一个语音片段。在许多情况下,说话人确定的延迟时间很大,并且不适合那些不使用说话人确定结果进行实时语音识别的说话人更替的情况。在该方法中,贝叶斯信息标准用于通过考虑在线性的确定方法来执行说话者二值化,同时顺序地检测多个说话者连续讲话的语音部分中的说话者翻转点。通过使用“多音素类别”模型,在该模型中,基于从识别中获得的音素信息对特征进行分类,我们的目标是提高说话者的区分精度,尤其是在较短的延迟时间内。说话人差异化实验的结果是,在提出的说话人判断方法中,与传统的单音素类整体音素模型相比,说话人差异误差在2秒的延迟时间内降低了20.0%。在使用说话者确定结果进行语音识别的在线说话者适应实验中,在说话者转折点之前和之后的语音获得了7.8%的单词错误减少率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号