首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価
【24h】

音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

机译:基于声学模型和语言模型的语音间隔检测免提语音识别算法的评估

获取原文
获取原文并翻译 | 示例
           

摘要

人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響モデルと言語モデルに基づく認識による音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価を行う.従来のVAD手法として振幅パワー,統計モデル,GMMなどに基づく手法を挙げ,性能比較実験を行うことで提案手法の有効性を示す.
机译:需要引入免提界面以实现人与语音对话机器人之间的自然对话,在免提语音识别系统中,各种背景噪音会混入其中,并且用户直接声音的能量会减弱。输入语音的信噪比(SNR)由于各种原因而降低,例如,随着SNR的降低,很难检测到识别用户语音片段的语音片段,并且在嘈杂的环境中有效。尚未建立语音片段检测方法,本文评估了一种免提语音识别算法,该算法使用基于声学模型和语言模型通过识别进行语音片段检测的算法,该模型即使在嘈杂的环境中也能可靠地检测用户的语音片段。通过引用基于幅度功率,统计模型,GMM等的方法(作为常规VAD方法)进行性能比较实验,我们将展示该方法的有效性。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号