首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >息継ぎ音を利用した電話音声の発話分割
【24h】

息継ぎ音を利用した電話音声の発話分割

机译:使用呼吸声对电话语音进行语音分割

获取原文
获取原文并翻译 | 示例
           

摘要

近年,音声認識を利用した通話監視技術に注目が集まっている.コールセンターを対象とした音声認識では,会話音声をあらかじめ発話単位に分割し,認識処理の不要な無音部分を取り除いた後,検出された発話の単位で認識処理を行う.そのため,各発話は文脈上意味のある単位で区切られていることが望ましい.しかし,従来の発話検出技術は,雑音の混入した入力信号から人間の発声部分を正確に抽出することにのみ焦点が当てられており,発話の検出単位については検討されてこなかった.本報告では,人間の息継ぎ音(吸気音)に注目し,入力信号から吸気音を高精度に検出することによって,入力音声を文脈上意味のある単位に,自動に分割する方法を提案する.提案法では,呼吸音に特化した音響特徴量を利用し,識別器を段階的に構成することによって吸気音を高精度に抽出する.提案法は97.4%の吸気音検出精度を達成し,音声認識性能の改善にも寄与することを確認した.
机译:近年来,注意力已经集中在使用语音识别的呼叫监视技术上。在用于呼叫中心的语音识别中,将对话语音预先划分为发声单元,去除识别过程中不必要的无声部分,然后在检测到的发声单元中执行识别处理。因此,期望每个发声被上下文中有意义的单元分隔。然而,常规的发声检测技术仅专注于从有噪声的输入信号中准确地提取人的发声,而没有检查发声检测单元。在本报告中,我们着重于人类的呼吸声(进气声),并提出了一种方法,该方法通过从输入信号中高精度检测进气声来自动将输入声分为有意义的单位。在提出的方法中,通过使用专用于呼吸声的声学特征逐步构造分类器,可以高精度地提取吸气声。证实了所提出的方法达到了97.4%的进气声检测精度,并有助于改善语音识别性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号