【24h】

息継ぎ音を利用した電話音声の発話分割

机译:使用呼吸声讲话讲话的讲话

获取原文
获取原文并翻译 | 示例
       

摘要

近年,音声認識を利用した通話監視技術に注目が集まっている.コールセンターを対象とした音声認識では,会話音声をあらかじめ発話単位に分割し,認識処理の不要な無音部分を取り除いた後,検出された発話の単位で認識処理を行う.そのため,各発話は文脈上意味のある単位で区切られていることが望ましい.しかし,従来の発話検出技術は,雑音の混入した入力信号から人間の発声部分を正確に抽出することにのみ焦点が当てられており,発話の検出単位については検討されてこなかった.本報告では,人間の息継ぎ音(吸気音)に注目し,入力信号から吸気音を高精度に検出することによって,入力音声を文脈上意味のある単位に,自動に分割する方法を提案する.提案法では,呼吸音に特化した音響特徴量を利用し,識別器を段階的に構成することによって吸気音を高精度に抽出する.提案法は97.4%の吸気音検出精度を達成し,音声認識性能の改善にも寄与することを確認した.
机译:近年来,注意使用语音识别引起了注意力监控技术。在呼叫中心的语音识别中,会话语音预先分成语音单元,并且在去除不必要的识别处理部分之后,以检测到的话语为单位执行识别处理。因此,希望每个语音被划分为上下文含义单元。然而,传统的语音检测技术仅集中在与混合输入信号完全提取人的话语部分,并且不考虑检测单位的语音。在本报告中,我们专注于人类令人叹为观的声音(进气声),并提出了一种通过测量高精度的进气声音来自动地分割输入语音的方法。在所提出的方法中,通过使用专门用于呼吸声和判别器的声学特征量,以高精度提取进气声。所提出的方法是进气声检测准确性的97.4%,并确认它还有助于改善语音识别性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号