【24h】

音声情報と画像情報を融合したダブルトーク検出

机译:结合语音信息和图像信息的双向通话检测

获取原文
获取原文并翻译 | 示例
           

摘要

テレビ会議システム等の拡声通話系で発生する音響エコーを除去する音響エコーキャンセラ(AEC: Acoustic Echo Canceller)の一つにサブ適応フィルタ(Sub-ADF: Sub Adaptive Filter)を用いた手法が提案されている.ここで用いられるダブルトーク検出器において,音声情報に加え画像情報も用いるマルチモーダル処理を行うことで,ダブルトーク検出の性能向上を図る.本稿では画像処理により得られる口唇画像を2値化処理し,得た画像特徴量を用い発話区間を検出する.これと音声情報を併用し,従来法の性能を上回るダブルトーク検出を実現する.
机译:作为消声回声消除器(AEC)之一,已经提出了使用Sub-ADF(子自适应滤波器)的方法,该方法消除了在扬声器通信系统(例如,视频会议系统)中产生的回声。有。在这里使用的双向通话检测器中,双向通话检测的性能通过执行除了音频信息之外还使用图像信息的多模式处理而得以改善。在本文中,将通过图像处理获得的嘴唇图像进行二值化,并使用获得的图像特征量检测发声区。通过将其与语音信息一起使用,实现了超越传统方法性能的双向通话检测。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号