首页> 外文期刊>電子情報通信学会技術研究報告 >複数人会話シーン分析におけるマイクロホンアレイ音声処理
【24h】

複数人会話シーン分析におけるマイクロホンアレイ音声処理

机译:用于多人对话场景分析的麦克风阵列语音处理

获取原文
获取原文并翻译 | 示例
           

摘要

Recognition and understanding of conversation scenes has recently been tackled to achieve a variety of tasks such as automatic annotation, minute taking, and meeting assistance. Since participants speak spontaneously in a conversation, a recorded conversation includes many speaker overlaps and ambient noise. To handle such complicated recordings, speech signal processing techniques play an important role. This paper outlines some multi-channel speech enhancement and "who spoke when" estimation (speaker diarization) techniques for conversation scene analysis.%近年,会話音声の自動アノテーションや議事録作成,会議支援などを目的に,会話音声を認識・理解する会話シーン分析の研究が国内外で盛んに行なわれている.会話においては,複数話者が自由に発話することから,収録音声は複数話者の声や環境雑音が重畳された複雑な構造をしており,音声認識などの分析を行なう際には,様々な音声処理技術が必要である.本稿では,会話シーン分析で用いられる,マイクロホンアレイによる音声強調処理と話者区間推定(ダイアライゼーション)にフォーカスを当て,その代表的な技術を紹介する.
机译:最近已经解决了对对话场景的识别和理解,以实现各种任务,例如自动注释,会议记录和会议帮助,由于参与者在对话中自发地讲话,因此记录下来的对话包括许多说话者重叠和周围的噪音。复杂的录音,语音信号处理技术起着重要的作用。本文概述了一些多通道语音增强和“说话时人说话”估计(说话者二值化)技术用于对话场景分析。%近年来,对话语音的自动注释和会议记录的创建,为了支持会议,在日本和海外积极进行识别和理解对话声音的对话场景分析的研究。在对话中,由于多个讲话者可以自由说话,所以所记录的声音具有复杂的结构,其中多个讲话者的声音和环境噪声被叠加。需要语音处理技术。在本文中,我们重点讨论用于对话场景分析的语音增强处理和使用麦克风阵列的说话人片段估计(拨号),并介绍它们的代表性技术。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号