SpeakerBeam: 聞きたい人の声に耳を傾けるコンピュータ──深層学習に基づく音声の選択的聴取

Marc Delcroix; Katerina Zmolikova; 木下 慶介; 荒木 章子; 小川 厚徳; 中谷 智広

首页> 外文期刊>NTT技術ジャーナル >SpeakerBeam: 聞きたい人の声に耳を傾けるコンピュータ──深層学習に基づく音声の選択的聴取

【24h】

SpeakerBeam: 聞きたい人の声に耳を傾けるコンピュータ──深層学習に基づく音声の選択的聴取

机译：SpeakerBeam：用来聆听您想听的人的声音的计算机──基于深度学习的选择性聆听声音

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

パーティ会場などの騒がしい環境の中でも，人は，聞きたい人（目的話者）の声に注目して，その声を聞き取ること（選択的聴取）ができます．一方，従来のコンピュータでも，話者の位置が分かっていれば，その位置から来る音だけを抽出することはできました．これに対し，本稿では，目的話者の声の特徴だけが分かっているときに，深層学習技術を用いて，その特徴に合致する声を抽出する新しい技術SpeakerBeamを紹介します.

机译：即使在聚会场所等嘈杂的环境中，人们也可以注意他们想听的人（目标说话者）的声音并听取该声音（选择性聆听）。另一方面，即使对于传统的计算机，如果知道扬声器的位置，也只能提取来自该位置的声音。另一方面，在本文中，我们将介绍SpeakerBeam，这是一种新技术，利用深度学习技术在仅知道目标说话者语音特征的情况下提取与目标说话者语音特征匹配的语音。

著录项

来源
《NTT技術ジャーナル》 |2018年第9期|共4页
作者
Marc Delcroix; Katerina Zmolikova; 木下慶介; 荒木章子; 小川厚徳; 中谷智広;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类无线电电子学、电信技术;
关键词
入库时间 2022-08-18 12:08:44

相似文献

外文文献
中文文献
专利

1. SpeakerBeam:聞きたい人の声に耳を傾けるコンピュータ——深層学習に基づく音声の選択的聴取 [J] . Marc Delcroix, Katerina Zmolikova, 木下慶介, NTT技术ジャ-ナル . 2018,第9期

机译：扬声器（SpeakErebeam）：计算机听取您想要基于深度学习的言语的人的声音
2. 聞きたい人の声に耳を傾けるAI ──深層学習に基づく音声の選択的聴取技術 SpeakerBeam [J] . Marc　Delcroix, 落合　翼（おちあい　つばさ）, 佐藤　宏（さとう　ひろし）, NTT技術ジャーナル . 2021,第7期

机译：ai-倾听你想听的人的声音
3. 聞きたい人の声に耳を傾けるコンピュータを実現 [J] . 坂井田規夫電子情報通信学会誌 . 2018,第10期

机译：实现一台可以听想听的人的声音的计算机
4. 深層ニューラルネットワークを用いた損傷判別におけるk近傍法とウェルチのt検定に基づく未学習損傷パターンデータの検知 [C] . 小檜山雅之, 普天間基, 岡一也, 日本材料学会;構造物の安全性?信頼性に関する国内シンポジウム . -1

机译：深度判别中基于k最近邻法和Welch t检验的未识别损伤模式数据在损伤识别中的应用
5. モデルベース深層強化学習におけるタスク依存の中間表現を用いた環境遷移モデルの学習利用統計を見る [D] . 水谷陽太 2019

机译：在基于模型的深度强化学习中查看使用任务相关中间表示的环境过渡模型的学习使用情况统计信息
6. ＜学会発表＞栗原彬・澤幸祐（2013）．社会的学習によって得られた情報の保持間隔に関する検討 : ラットの食物選択場面を用いて．日本心理学会第 77 回大会，札幌コンベンションセンター（北海道医療大学）．（研究プロジェクト文部科学省私立大学戦略的研究基盤形成支援事業「融合的心理科学の創成 : 心の連続性を探る」） [O] . 栗原彬 2014

机译：<会议报告> saturi Kurihara和Kosuke sawa（2013年）。关于通过社会学习获得的信息的保留间隔的检查：使用大鼠的食物选择场景。日本心理学会第77次年会，札幌会展中心（北海道医科大学）。（研究项目：教育，文化，体育，科学技术部，民办大学战略研究基金支援项目“综合心理科学的创造：探索心灵的连续性”）

SpeakerBeam: 聞きたい人の声に耳を傾けるコンピュータ──深層学習に基づく音声の選択的聴取

摘要

著录项

相似文献

相关主题

期刊订阅