音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討

浦上　弘嗣; 梶川　嘉延; 棟安　実治

首页> 外文期刊>電子情報通信学会技術研究報告 >音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討

【24h】

音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討

机译：回声消除器中多模式信号处理的双向通话检测研究

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿ではマルチモーダル情報（音響情報および画像情報）を用いたダブルトーク検出について検討を行う．音響エコーキヤンセラ（Acoustic Echo Canceller：AEC）はハンズフリーシステムやテレビ会議システムで用いられる．ところが，近端話者と遠端話者が同時に発話するダブルトーク状態では音響エコーキヤンセラの性能が劣化してしまう．そこで，サブ適応フィルタ（Sub Adaptive filter：Sub-ADF）を用いた音響エコーキヤンセラが捷案されている．しかし，この方法で用いられているダブルトーク検出器はダブルトーク状態を正確に検出することができない．そこで本稿では，ダブルトーク検出器の性能を向上させるためにマルチモーダル情報を用いたダブルトーク検出器を提案する．提案するダブルトーク検出器は二億化した口唇画像から得た画像情報とマイクロホン出力信号と適応フィルタ出力信号のパワーとの相関から得た音響情報から発話状態を検出する．そしてシミュレーションにより，従来手法と比較し提案手法の有用性を示す．%In this paper, we propose a double-talk-detector using multi-modal information (sound and image). An acoustic echo cancellation is used for hands-free telecommunication and teleconference systems. However, the performance of the acoustic echo cancellation deteriorates according to a double talk where the near-end talker and the far-end talker simultaneously utter. For this problem, the acoustic echo canceller (AEC) using Sub-Adaptive-Filter (Sub-ADF) has been already proposed. However, the double-talk detector cannot detect double-talk situations correctly. Therefore, we propose a double-talk detector using multi-modal information in order to improve the performance of the double-talk detector. The proposed double-talk detector detects a voice activity from image information which is obtained from binarized lip image and acoustic information which is obtained from the correlation between the microphone output and the adaptive filter output. Simulation results demonstrate that the proposed double-talk detector can improve the performance compared with the conventional one.

机译：在本文中，我们研究了使用多模式信息（声音信息和图像信息）进行的双向通话检测。回声消除器（AEC）用于免提系统和视频会议系统。但是，在近端扬声器和远端扬声器同时讲话的双向通话状态下，声学回声消除器的性能下降。因此，已经提出了使用子自适应滤波器（Sub-ADF）的声学回声消除器。但是，在该方法中使用的双向通话检测器不能准确地检测双向通话状态。因此，在本文中，我们提出了一种使用多模态信息的双向通话检测器，以提高双向通话检测器的性能。提出的双向通话检测器根据从数亿个嘴唇图像获得的图像信息和根据麦克风输出信号与自适应滤波器输出信号的功率之间的相关性获得的声学信息来检测发声状态。然后，与传统方法相比，通过仿真显示了该方法的有效性。本文中，我们提出了一种使用多模式信息（声音和图像）的双向通话检测器。声学回声消除技术被用于免提电信和电话会议系统中，但是声学回声消除技术的性能会因针对这个问题，已经提出了使用Sub-Adaptive-Filter（Sub-ADF）的声学回声消除器（AEC），但是，近端说话者和远端说话者同时发声的双向通话。通话检测器无法正确检测到通话双方的情况。因此，我们提出了一种使用多模态信息的通话检测器，以提高通话检测器的性能。从二值化后的嘴唇图像获得的声音信息和从麦克风输出与自适应滤波器输出之间的相关性获得的声学信息。仿真结果表明与传统的双向通话检测器相比，使用双向通话检测器可以提高性能。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第440期|p.397-402|共6页
作者
浦上　弘嗣; 梶川　嘉延; 棟安　実治;
展开▼
作者单位

関西大学システム理工学部　〒564-8680大阪府吹田市山手町3-3-35;

関西大学システム理工学部　〒564-8680大阪府吹田市山手町3-3-35;

関西大学システム理工学部　〒564-8680大阪府吹田市山手町3-3-35;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
音響エコーキヤンセラ; 適応アルゴリズム; ダブルトーク検出; マルチモーダル; 回転補正;

机译：回声消除器;自适应算法;双向通话检测;多模态;旋转校正;
入库时间 2022-08-18 00:30:11

相似文献

外文文献
中文文献
专利

1. 音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討 [J] . 浦上　弘嗣, 梶川　嘉延, 棟安　実治電子情報通信学会技術研究報告 . 2011,第439期

机译：回声消除器中多模式信号处理的双向通话检测研究
2. 音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討 [J] . 浦上　弘嗣, 梶川　嘉延, 棟安　実治電子情報通信学会技術研究報告 . 2011,第441期

机译：回声消除器中多模式信号处理的双向通话检测研究
3. 音響エコーキャンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討 [J] . 浦上弘嗣, 梶川嘉延, 棟安実治電子情報通信学会技術研究報告. 信号処理. Signal Processing . 2010,第440期

机译：回声消除器中通过多模态信号处理进行的双向通话检测
4. RCMオーダリングで現れるレベル構造を援用したブロックマルチカラーオーダリングによる前処理付きMRTR法の並列化に関する検討 [C] . 圓谷友紀, 岡本吉史, 里周二電気学会全国大会 . 2015

机译：RCM排序中出现水平结构的块多色排序对预处理MRTR方法的并排化研究
5. アセチルコリンの冠注で誘発されるブタの主および小冠動脈攣縮モデルの開発とこのモデル動物を用いたニプラジロール, イソソルビド?ジニトレート, ブナゾシンの冠攣縮予防効果に関する研究 [D] . Kawamura, Atsushi 1991

机译：冠状动脉注入乙酰胆碱诱导的猪主，小冠状动脉痉挛模型的建立以及尼泊地洛尔，硝酸异山梨酯和布那唑嗪对模型动物的预防作用研究
6. 心内膜描出不良例における経静脈性コントラスト製剤レボビスト使用による心内膜同定の検討 : ファンダメンタルイメージと組織ハーモニックイメージとコントラストハーモニックイメージでの比較 [O] . 芳谷英俊 2004

机译：利用经静脉造影剂Levovist检测心内膜成像不良患者的心内膜识别：基础图像，组织谐波图像和对比度谐波图像的比较

音響エコーキヤンセラにおけるマルチモーダル信号処理によるダブルトーク検出の検討

摘要

著录项

相似文献

相关主题

期刊订阅