首页> 外文期刊>電子情報通信学会技術研究報告 >音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討
【24h】

音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討

机译:回声消除器中多模式信号处理的双向通话检测研究

获取原文
获取原文并翻译 | 示例
       

摘要

本稿ではマルチモーダル情報(音響情報および画像情報)を用いたダブルトーク検出について検討を行う.音響エコーキヤンセラ(Acoustic Echo Canceller:AEC)はハンズフリーシステムやテレビ会議システムで用いられる.ところが,近端話者と遠端話者が同時に発話するダブルトーク状態では音響エコーキヤンセラの性能が劣化してしまう.そこで,サブ適応フィルタ(Sub Adaptive filter:Sub-ADF)を用いた音響エコーキヤンセラが捷案されている.しかし,この方法で用いられているダブルトーク検出器はダブルトーク状態を正確に検出することができない.そこで本稿では,ダブルトーク検出器の性能を向上させるためにマルチモーダル情報を用いたダブルトーク検出器を提案する.提案するダブルトーク検出器は二億化した口唇画像から得た画像情報とマイクロホン出力信号と適応フィルタ出力信号のパワーとの相関から得た音響情報から発話状態を検出する.そしてシミュレーションにより,従来手法と比較し提案手法の有用性を示す.%In this paper, we propose a double-talk-detector using multi-modal information (sound and image). An acoustic echo cancellation is used for hands-free telecommunication and teleconference systems. However, the performance of the acoustic echo cancellation deteriorates according to a double talk where the near-end talker and the far-end talker simultaneously utter. For this problem, the acoustic echo canceller (AEC) using Sub-Adaptive-Filter (Sub-ADF) has been already proposed. However, the double-talk detector cannot detect double-talk situations correctly. Therefore, we propose a double-talk detector using multi-modal information in order to improve the performance of the double-talk detector. The proposed double-talk detector detects a voice activity from image information which is obtained from binarized lip image and acoustic information which is obtained from the correlation between the microphone output and the adaptive filter output. Simulation results demonstrate that the proposed double-talk detector can improve the performance compared with the conventional one.
机译:在本文中,我们研究了使用多模式信息(声音信息和图像信息)进行的双向通话检测。回声消除器(AEC)用于免提系统和视频会议系统。但是,在近端扬声器和远端扬声器同时讲话的双向通话状态下,声学回声消除器的性能下降。因此,已经提出了使用子自适应滤波器(Sub-ADF)的声学回声消除器。但是,在该方法中使用的双向通话检测器不能准确地检测双向通话状态。因此,在本文中,我们提出了一种使用多模态信息的双向通话检测器,以提高双向通话检测器的性能。提出的双向通话检测器根据从数亿个嘴唇图像获得的图像信息和根据麦克风输出信号与自适应滤波器输出信号的功率之间的相关性获得的声学信息来检测发声状态。然后,与传统方法相比,通过仿真显示了该方法的有效性。本文中,我们提出了一种使用多模式信息(声音和图像)的双向通话检测器。声学回声消除技术被用于免提电信和电话会议系统中,但是声学回声消除技术的性能会因针对这个问题,已经提出了使用Sub-Adaptive-Filter(Sub-ADF)的声学回声消除器(AEC),但是,近端说话者和远端说话者同时发声的双向通话。通话检测器无法正确检测到通话双方的情况。因此,我们提出了一种使用多模态信息的通话检测器,以提高通话检测器的性能。从二值化后的嘴唇图像获得的声音信息和从麦克风输出与自适应滤波器输出之间的相关性获得的声学信息。仿真结果表明与传统的双向通话检测器相比,使用双向通话检测器可以提高性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号