首页> 外文期刊>電子情報通信学会技術研究報告 >エルゴードHMMを用いたオンライン話者クラスタリングおよび議事録作成への応用
【24h】

エルゴードHMMを用いたオンライン話者クラスタリングおよび議事録作成への応用

机译:使用遍历HMM的在线说话者聚类及其在分钟制作中的应用

获取原文
获取原文并翻译 | 示例
           

摘要

リアルタイム性が求められる応用に適した,オンライン話者クラスタリングの新しい手法を提案する.提案法は,エルゴード型の隠れマルコフモデル(HMM)を発話の生成モデルとし,変分ベイズ法に基づくインクリメンタル学習を適用することにより,逐次入力される発話をその履歴も考慮して正確に分頬する.会議音声を用いた実験を通して,提案法が分類誤りを60-80%削減できることや,教師なし話者適応と組み合わせた大語彙連続音声認識での認識誤り削減効果などを示す.%A novel online speaker clustering method suitable for real-time applications is proposed. Using an ergodic hidden Markov model (HMM), it employs incremental learning based on a variational Bayesian framework and provides probabilistic (non-deterministic) decisions for each input utterance, directly considering the specific history of preceding utterances. It makes possible more robust cluster estimation and precise classification of utterances than do conventional online methods. Experiments on meeting-speech data show that the proposed method produces 60-80% fewer classification errors than a conventional method does. They also show that it reduces speech recognition errors when combined with unsupervised speaker adaptation.
机译:我们提出了一种适用于实时应用的在线说话者聚类的新方法,该方法以遍历式隐马尔可夫模型(HMM)作为发声生成模型,并基于变分贝叶斯方法进行增量学习。通过应用该方法,考虑到历史,将顺序输入的语音准确地分为两颊,通过会议语音的实验,该方法可以将分类错误减少60%至80%,并且无需监督说话者的适应性。提出了一种适合实时应用的在线说话者聚类新方法,采用遍历隐马尔可夫模型(HMM),采用基于贝叶斯变分框架,直接考虑先前话语的特定历史记录,为每种输入话语提供概率(非确定性)决策,与传统的在线方法相比,它使话语的聚类估计和精确分类成为可能。数据表明,与传统方法相比,该方法产生的分类错误少60%至80%,并且还表明,与无监督说话人自适应相结合,该方法可以减少语音识别错误。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号