複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討

西亀健太; 渡部晋治; 西本卓也; 小野順貴; 嵯峨山茂樹; Kenta NISHIKI; Shinji WATANABE; Takuya NISHIMOTO; Nobutaka ONO; Shigeki SAGAYAMA

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討

【24h】

複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討

机译：在单一模型学习中使用多重混响特性下的语音在未知混响环境中的鲁棒语音识别测试

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

残響環境下では音声認識性能は著しく著しく劣化する．これに対し，人工残響インパルス応答をクリーン音声に畳み込んで学習することで，認識率が向上することが知られている．しかし，どのような残響インパルス応答を畳み込んで学習すべきか，という点に関しては十分に議論がなされていない．本研究では，人工残響インパルス応答の残響時間パラメータと認識率の関係を残響音声認識評価基盤(CENSREC-4)を用いて詳細に調べ，認識率が大きく変わる残響時間パラメータの範囲がテスト環境より短い残響時間に分布していることを述べる．また，その範囲に基づいて人工残響インパルス応答を選択しマルチコンディション学習を行うことが，未知残響環境に対して頑健な音声認識であることを示す．

机译：在混响环境中，语音识别性能会大大降低。另一方面，已知可以通过将人工混响脉冲响应卷积为纯净的声音来学习来提高识别率。但是，对于应混叠哪种混响脉冲响应进行学习，目前还没有足够的讨论。在这项研究中，使用混响语音识别评估平台（CENSREC-4）详细研究了人工混响脉冲响应的混响时间参数与识别率之间的关系，其识别率变化明显的混响时间参数范围比测试环境短。描述了它在混响时间内分布。我们还表明，基于该范围选择人工混响脉冲响应并执行多条件学习对于未知混响环境来说是可靠的语音识别。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2008年第66期|共6页
作者
西亀健太; 渡部晋治; 西本卓也; 小野順貴; 嵯峨山茂樹; Kenta NISHIKI; Shinji WATANABE; Takuya NISHIMOTO; Nobutaka ONO; Shigeki SAGAYAMA;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
残響環境; 音声認識; モデル学習; 人工残響; インパルス応答; 残響時間; Reverberant environment; Speech recognition; Model construction; Artificial reverberance; Impulse response; Reverberation time;

机译：混响环境;语音识别;模型学习;人工混响;脉冲响应;混响时间;混响环境;语音识别;模型构建;人工混响;脉冲响应;混响时间;

相似文献

外文文献
中文文献
专利

1. 複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討 [J] . 西亀健太, 渡部晋治, 西本卓也, 電子情報通信学会技術研究報告. 音声. Speech . 2008,第66期

机译：在单一模型学习中使用多重混响特性下的语音在未知混响环境中的鲁棒语音识别测试
2. 複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討 [J] . 西亀　健太, 渡部　晋治, 西本　卓也, 電子情報通信学会技術研究報告 . 2008,第66期

机译：单模式学习中具有多重混响特性的语音在未知混响环境中鲁棒语音识别的研究
3. 複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討 [J] . 西亀健太, 渡部晋治, 西本卓也, 電子情報通信学会技術研究報告. 福祉情報工学. Welfare Information Technology . 2008,第67期

机译：在单一模型学习中使用多重混响特性下的语音在未知混响环境中的鲁棒语音识别测试
4. 実環境下における音声認識率向上のための残響除去技術の検討 [C] . 大田健紘, 柳田益造情報処理学会全国大会 . 2004

机译：检查混响去除技术以提高真实环境中的语音识别率
5. モデルベース深層強化学習におけるタスク依存の中間表現を用いた環境遷移モデルの学習利用統計を見る [D] . 水谷陽太 2019

机译：在基于模型的深度强化学习中查看使用任务相关中间表示的环境过渡模型的学习使用情况统计信息
6. 音声区間検出を用いた雑音環境下で頑健な単語音声認識に関する研究 [O] . 有冨智志 2016

机译：语音区间检测在嘈杂环境中的健壮词语音识别研究

複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討

摘要

著录项

相似文献

相关主题

期刊订阅