首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応
【24h】

音声·画像のモダリティ間の相互作用に着目した音声認識のモデル適応

机译:专注于语音和图像模态之间交互的语音识别模型适配

获取原文
获取原文并翻译 | 示例
       

摘要

本論文は,マルチモーダル音声認識におけるMLLR法を用いたモデル適応において,音響情報と画像情報がそれぞれ異なるモダリティに与える影響(モダリティ間の効果)について調査するものである.マルチモーダル音声認識のモデル適応ではモダリティ間の情報が音声認識の精度向上に有効に働いている可能性がある.そこで,モダリティ間の効果が有効であるか否か調査を行った.具体的には,MLLR法の変換行列にいくつかの変化を加えてモデル適応を行い認識精度を比較した.実験にはマルチモーダル音声認識コーパスに音響雑音を加えたデータを使用した.実験の結果から,モダリティ間の情報の有効性が確認された.
机译:本文研究了在多模态语音识别中使用MLLR方法进行模型自适应时,声学信息和图像信息对不同模态(模态之间的影响)的影响。在多模式语音识别的模型适配中,模态之间的信息可以有效地工作以提高语音识别的准确性。因此,我们调查了模态之间的效果是否有效。具体来说,我们对MLLR方法的转换矩阵进行了一些更改,应用了模型,并比较了识别精度。对于实验,我们使用了通过向多模式语音识别语料库添加声学噪声而获得的数据。从实验结果,证实了模态之间信息的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号