同時発話の高性能な音声認識－スペクトル減算による分離の高速化と分離音を用いた音響モデル学習

出木浦悠人; 松本哲也; 竹内義則; 工藤博章; 大西昇; 北岡教英; 武田一哉

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >同時発話の高性能な音声認識－スペクトル減算による分離の高速化と分離音を用いた音響モデル学習

【24h】

同時発話の高性能な音声認識－スペクトル減算による分離の高速化と分離音を用いた音響モデル学習

机译：高性能语音识别分离和声学模型学习的同时语音分离使用孤立声音

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本研究の目的は，同時発話を高性能に音声認識することである．認識のためには音源分離が必要であるが，その過程で生じる音響的な歪みや残留雑音により，認識精度の改善幅はある水準に留まる．また，従来用いられてきた独立成分分析による分離は，処理時間が長いことも問題である．本研究では，歪みを含む分離音を用いて音響モデル学習を行うことと，混合音から推定した他者発話スペクトルを減算する音源分離手法を提案する．計算機シミュレーションによる認識実験で，提案法による分離音の認識精度は従来法に比べて約6%改善し，処理時間が約1/5に短縮された．また，分離音を学習データに用いることにより，認識精度がさらに約20%改善されることを示した．

机译：本研究的目的是言语识别同时语音高性能。尽管识别所需的声源分离，但过程中产生的声应变和残余噪声保持在一定程度。此外，通常使用的独立分量分析分离也是处理时间长的问题。在本研究中，我们提出了一种用于执行声学模型学习的声源分离方法，并减去从混合声音估计的其他话语频谱，并使用包括失真的分离声音。在通过计算机模拟的识别实验中，与常规方法相比，所提出的方法的分离声音的识别精度已经提高了约6％，并且处理时间缩短至约1/5。此外，通过使用用于学习数据的分离声，识别精度进一步提高了约20％。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2014年第91期|共6页
作者
出木浦悠人; 松本哲也; 竹内義則; 工藤博章; 大西昇; 北岡教英; 武田一哉;
展开▼
作者单位

名古屋大学大学院情報科学研究科;

名古屋大学大学院情報科学研究科;

大同大学情報学部情報システム学科;

名古屋大学大学院情報科学研究科;

名古屋大学大学院情報科学研究科;

名古屋大学大学院情報科学研究科;

名古屋大学大学院情報科学研究科;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
音声認識; 音源分離; 発話スペクトル推定; スペクトルサブトラクション;

机译：语音识别;声源分离;语音频谱估计;光谱减法;

相似文献

外文文献
中文文献
专利

1. 同時発話の高性能な音声認識－スペクトル減算による分離の高速化と分離音を用いた音響モデル学習 [J] . 出木浦悠人, 松本哲也, 竹内義則, 電子情報通信学会技術研究報告. 音声. Speech . 2014,第91期

机译：高效的语音识别功能，通过频谱减法同时实现语音加速分离，并使用分离的声音进行声学模型学习
2. 同時発話の高性能な音声認識－スペクトル減算による分離の高速化と分離音を用いた音響モデル学習 [J] . 出木浦悠人, 松本哲也, 竹内義則, 電子情報通信学会技術研究報告. 音声. Speech . 2014,第91期

机译：高性能语音识别分离和声学模型学习的同时语音分离使用孤立声音
3. 同時発話の高性能な音声認識－スペクトル減算による分離の高速化と分離音を用いた音響モデル学習 [J] . 出木浦悠人, 松本哲也, 竹内義則, 電子情報通信学会技術研究報告. 福祉情報工学. Welfare Information Technology . 2014,第92期

机译：高性能语音识别分离和声学模型学习的同时语音分离使用孤立声音
4. 震源情報を用いた建築非構造部材の統計的な地震応答評価手法その1 偶発的・認識論的不確かさを分離した応答スペクトルの深層学習 [C] . 金子健作, 岩崎友洋日本建築学会大会;日本建築学会 . 2020

机译：建筑非结构构件的统计地震响应评价方法使用地震信息第1部分深入学习响应谱分离意外识别不确定性
5. う蝕原性レンサ球菌が作る多糖の構造ならびにその多糖を分解する酵素に関する研究　Ⅰ. 不溶性および可溶性のグルカンとフルクタンの構造　Ⅱ. 不溶性グルカン分解酵素の分離?精製およびその作用 [D] . 恵比須, 繁之 -1

机译：致龋性链球菌产生的多糖的结构和分解多糖的酶的研究I.不溶性和可溶性葡聚糖和果聚糖的结构II。不溶性葡聚糖降解酶的分离纯化及其作用
6. 階層型ニューラルネットワークを用いた独立成分分析による信号分離と未学習音声への適応評価 [O] . 2013

机译：使用分层神经网络和非读物语音的自适应评估评估独立分量分析信号分离

同時発話の高性能な音声認識－スペクトル減算による分離の高速化と分離音を用いた音響モデル学習

摘要

著录项

相似文献

相关主题

期刊订阅