音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応

大西正真; 田村哲嗣; 速水悟

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応

【24h】

音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応

机译：专注于语音和图像模态之间交互的语音识别模型适配

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本論文は，マルチモーダル音声認識におけるMLLR法を用いたモデル適応において，音響情報と画像情報がそれぞれ異なるモダリティに与える影響（モダリティ間の効果）について調査するものである．マルチモーダル音声認識のモデル適応ではモダリティ間の情報が音声認識の精度向上に有効に働いている可能性がある．そこで，モダリティ間の効果が有効であるか否か調査を行った．具体的には，MLLR法の変換行列にいくつかの変化を加えてモデル適応を行い認識精度を比較した．実験にはマルチモーダル音声認識コーパスに音響雑音を加えたデータを使用した．実験の結果から，モダリティ間の情報の有効性が確認された．

机译：本文研究了在多模态语音识别中使用MLLR方法进行模型自适应时，声学信息和图像信息对不同模态（模态之间的影响）的影响。在多模式语音识别的模型适配中，模态之间的信息可以有效地工作以提高语音识别的准确性。因此，我们调查了模态之间的效果是否有效。具体来说，我们对MLLR方法的转换矩阵进行了一些更改，应用了模型，并比较了识别精度。对于实验，我们使用了通过向多模式语音识别语料库添加声学噪声而获得的数据。从实验结果，证实了模态之间信息的有效性。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2011年第97期|共6页
作者
大西正真; 田村哲嗣; 速水悟;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
マルチモーダル音声認識; モデル適応; モダリティ間の影響; マルチーダル音声認識コーパス;

机译：多模式语音识别;模型适应;模态之间的影响;多模式语音识别语料库;

相似文献

外文文献
中文文献
专利

1. 音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応 [J] . 大西正真, 田村哲嗣, 速水悟電子情報通信学会技術研究報告. 音声. Speech . 2011,第97期

机译：专注于语音和图像模态之间交互的语音识别模型适配
2. 音声・画像のモダリティ間の相互作用に着目した音声認識のモデル適応 [J] . 大西　正真, 田村　哲嗣, 速水　悟電子情報通信学会技術研究報告 . 2011,第97期

机译：专注于语音和图像模态之间交互的语音识别模型适配
3. 音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応 [J] . 大西正真, 田村哲嗣, 速水悟電子情報通信学会技術研究報告. 音声. Speech . 2011,第97期

机译：语音识别模型适应专注于音频和图像模式互动
4. 音声認識システムにおける音韻的類似表現を考慮した言語モデルのタスク適応 [C] . 大山　景詞, 延澤　志保, 太原　育夫情報処理学会全国大会 . 2006

机译：语音识别系统中考虑语音相似表达的语言模型任务自适应
5. Ni(II)-Fe(II) 混成ヘモグロビンの研究 : Ni(II)プロトボルフィリンIXをデオキシヘムのモデルとして用いたヘモグロビンの酸素結合における中間状態の研究 [D] . 柴山, 修哉 1988

机译：Ni（II）-Fe（II）杂合血红蛋白的研究：使用Ni（II）原卟啉IX作为脱氧血红素模型研究血红蛋白氧结合的中间状态
6. WWWから得られる検索語重み付けと話題適応に基づく音声認識のための言語モデル [O] . 宮崎将隆 2010

机译：基于从WWW获得的搜索词加权和主题自适应的语音识别语言模型

音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応

摘要

著录项

相似文献

相关主题

期刊订阅