利用環境変動に頑健な分岐選択型DNN音響モデルの検討

森谷崇史; 浅見太一; 山口義和青野裕司

首页> 外文期刊>電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics >利用環境変動に頑健な分岐選択型DNN音響モデルの検討

【24h】

利用環境変動に頑健な分岐選択型DNN音響モデルの検討

机译：利用環境変動に頑健な分岐選択型DNN音響モデルの検討

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相关主题

摘要

近年Deep Neural Network（DNN）の応用により，音声認識技術が様々な場面で利用されている．しかしながら音声認識システムにおいて高精度な認識結果を得るためには利用する環境ごとに対応した音響モデルを用意しなければならない．各音響モデルの学習にはそれぞれの利用環境に応じた大量の学習データと計算時間を必要とするため非常にコストがかかる．この問題に対して1つの音響モデルで複数の利用環境に対応するために複数の利用環境の音声を合わせて学習する方法が挙げられる．しかし，複数の利用環境の音声を合わせてDNNを学習する場合，DNNが音素などのシンボルの識別を行なうときに利用環境間の音声が互いに惑影響を及ぼす可能性がある．そこで本研究では利用する環境の違いに頑健な音響モデルの学習方法を提案する．具体的には，DNNの入力層を利用環境の数だけ分岐させ，出力層あるいは中間層で分岐を結合することで，各分岐が利用環境ごとに学習できるようなDNN音響モデルを構築する．この音響モデルを用いることで，分岐しないDNNと比べて文字正解精度の相対誤り改善率は9.6となり，提案するDNN音響モデルの有効性を示した．

著录项

来源
《電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics》 |2016年第475期|277-282|共6页
作者
森谷崇史; 浅見太一; 山口義和青野裕司;
展开▼
作者单位

日本電信電話株式会;

NTTメディアインテリジェンス研究所;

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类声学工程;
关键词
音声認識; 音響モデル; 耐雑音性; Deep Neural Network;
入库时间 2024-01-25 20:35:29

利用環境変動に頑健な分岐選択型DNN音響モデルの検討

摘要

著录项

相关主题

期刊订阅