複数人会話シーン分析におけるマイクロホンアレイ音声処理

荒木　章子; 藤本　雅清; 吉岡　拓也; 堀　貴明; 中谷　智広

首页> 外文期刊>電子情報通信学会技術研究報告 >複数人会話シーン分析におけるマイクロホンアレイ音声処理

【24h】

複数人会話シーン分析におけるマイクロホンアレイ音声処理

机译：用于多人对话场景分析的麦克风阵列语音处理

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Recognition and understanding of conversation scenes has recently been tackled to achieve a variety of tasks such as automatic annotation, minute taking, and meeting assistance. Since participants speak spontaneously in a conversation, a recorded conversation includes many speaker overlaps and ambient noise. To handle such complicated recordings, speech signal processing techniques play an important role. This paper outlines some multi-channel speech enhancement and "who spoke when" estimation (speaker diarization) techniques for conversation scene analysis.%近年，会話音声の自動アノテーションや議事録作成，会議支援などを目的に，会話音声を認識・理解する会話シーン分析の研究が国内外で盛んに行なわれている．会話においては，複数話者が自由に発話することから，収録音声は複数話者の声や環境雑音が重畳された複雑な構造をしており，音声認識などの分析を行なう際には，様々な音声処理技術が必要である．本稿では，会話シーン分析で用いられる，マイクロホンアレイによる音声強調処理と話者区間推定（ダイアライゼーション）にフォーカスを当て，その代表的な技術を紹介する．

机译：最近已经解决了对对话场景的识别和理解，以实现各种任务，例如自动注释，会议记录和会议帮助，由于参与者在对话中自发地讲话，因此记录下来的对话包括许多说话者重叠和周围的噪音。复杂的录音，语音信号处理技术起着重要的作用。本文概述了一些多通道语音增强和“说话时人说话”估计（说话者二值化）技术用于对话场景分析。％近年来，对话语音的自动注释和会议记录的创建，为了支持会议，在日本和海外积极进行识别和理解对话声音的对话场景分析的研究。在对话中，由于多个讲话者可以自由说话，所以所记录的声音具有复杂的结构，其中多个讲话者的声音和环境噪声被叠加。需要语音处理技术。在本文中，我们重点讨论用于对话场景分析的语音增强处理和使用麦克风阵列的说话人片段估计（拨号），并介绍它们的代表性技术。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第27期|p.83-88|共6页
作者
荒木　章子; 藤本　雅清; 吉岡　拓也; 堀　貴明; 中谷　智広;
展开▼
作者单位

日本電信電話株式会社NTTコミュニケーション科学基礎研究所　〒619-0237京都府相楽郡精華町光台2-4;

日本電信電話株式会社NTTコミュニケーション科学基礎研究所　〒619-0237京都府相楽郡精華町光台2-4;

日本電信電話株式会社NTTコミュニケーション科学基礎研究所　〒619-0237京都府相楽郡精華町光台2-4;

日本電信電話株式会社NTTコミュニケーション科学基礎研究所　〒619-0237京都府相楽郡精華町光台2-4;

日本電信電話株式会社NTTコミュニケーション科学基礎研究所　〒619-0237京都府相楽郡精華町光台2-4;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
会話シーン分析; 遠隔発話; 音声強調; ビームフォーミング; ダイアライゼーション;

机译：会话场景分析;远程语音;语音增强;波束形成;扩音;

相似文献

外文文献
中文文献
专利

1. 複数人会話シーン分析におけるマイクロホンアレイ音声処理 [J] . 荒木章子, 藤本雅清, 吉岡拓也, 電子情報通信学会技術研究報告. 信号処理. Signal Processing . 2011,第27期

机译：多人对话场景分析中的麦克风阵列语音处理
2. 複数人会話シーン分析におけるマイクロホンアレイ音声処理 [J] . 荒木章子, 藤本雅清, 吉岡拓也, 電子情報通信学会技術研究報告. 音声. Speech . 2011,第28期

机译：多人对话场景分析中的麦克风阵列语音处理
3. ［招待講演］複数人会話シーン分析におけるマイクロホンアレイ音声処理 [J] . 荒木　章子, 藤本　雅清, 吉岡　拓也, 電子情報通信学会技術研究報告 . 2011,第26期

机译：[邀请演讲]用于多人对话场景分析的麦克风阵列语音处理
4. 複数のマイクロホンアレイによる音源アクティビティ：小学校理科室におけるデータ分析 [C] . 石井カルロス寿憲, Jani EVEN, 塩見昌裕, Annual Conference of the Robotics Society of Japan . 2013

机译：麦克风阵列的声音活动：小学科学室的数据分析
5. 担癌?炎症状態におけるマウスシステインプロテアーゼインヒビター／低分子キニノーゲンおよびラットT-キニノーゲンに関する研究 [D] . 伊藤, 徳夫 1992

机译：荷瘤和炎症条件下小鼠半胱氨酸蛋白酶抑制剂/低分子量激肽原和大鼠T激肽原的研究
6. エロスの軌跡（3） : 　ハンス・ブリューアー、マグヌス・ヒルシュフェルト、ジークムント・フロイトにおけるホモ・セクシュアリティーの理論 [O] . 福元圭太, Fukumoto Keita 1997

机译：爱神的轨迹（3）：汉斯·布鲁尔，马格努斯·赫希菲尔德和西格蒙德·弗洛伊德的同性恋性理论

複数人会話シーン分析におけるマイクロホンアレイ音声処理

摘要

著录项

相似文献

相关主题

期刊订阅