首页> 外文期刊>電子情報通信学会技術研究報告 >Dirichlet事前分布を用いた音声区間検出の検討
【24h】

Dirichlet事前分布を用いた音声区間検出の検討

机译:基于Dirichlet先验分布的语音片段检测研究。

获取原文
获取原文并翻译 | 示例
           

摘要

This paper introduce the Drichlet prior into a statistical model-based voice activity detection (VAD), and shows its advantage. The statistical model-based VAD identify speech / non-speech period based on environmental adapted speech and non-speech GMMs which are constructed by the Switching Kalman filter. The constructed GMMs include important and unimportant Gaussian distributions. Thus, the performance of VAD can be improved by reducing unimportant Gaussian distribution. Here, prior probabilities of each remaining distribution may drastically change, because the distribution shape after the Gaussian reduction is much different from original GMM. Thus, we propose an optimization method of prior probabilities by using the Drichlet prior.%本研究では,確率モデルに基づく音声区間検出法にDirichlet事前分布を導入して音声区間検出の性能改善が得られることを述べる.確率モデルに基づく音声区間検出法では,Switchingカルマンフィルタを用いて観測信号の環境に適応した音声/非音声GMMを逐次生成し,各GMMの確率比に基づき音声/非音声の識別を行っている.生成されるGMMには不要な分布と重要な分布が混在しており,不要な分布を取り除き,重要な分布のみを用いることによりVADの性能改善が得られる.分布の削減を行うと,削減前の混合分布とは分布全体の形状が大きく異なり,分布の事前確率も大きく異なる.このため,本研究では,事前分布をDirichlet分布で定義し,分布選択後の混合重みを最適化することについて検討を行った.
机译:本文将Drichlet先验算法引入基于统计模型的语音活动检测(VAD)中,并展示其优势。基于统计模型的VAD基于环境适应性语音和非语音GMM识别语音/非语音时段构造的GMM包含重要且不重要的高斯分布,因此可以通过减少不重要的高斯分布来提高VAD的性能。减少与原始GMM有很大不同,因此,我们提出了一种使用Drichlet优先级的优化先验概率的方法。%在本研究中,我们将Dirichlet优先级分布引入基于概率模型的语音片段检测方法中,以提高语音片段检测的性能。在基于概率模型的语音片段检测方法中,使用切换卡尔曼滤波器顺序生成适合于所观察信号环境的语音/非语音GMM,并基于每个GMM的概率比计算语音/非语音。识别语音,生成的GMM包含不必要的分布和重要的分布,可以通过删除不必要的分布并仅使用重要的分布来提高VAD性能。当减少由于整个布料的形状非常不同,并且先验分布的可能性也非常不同。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2009年第355期|p.65-70|共6页
  • 作者单位

    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所;

    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所;

    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号