首页> 外文期刊>電子情報通信学会技術研究報告 >構造的特徴量に対する多段階の垂回帰分析による発音評価
【24h】

構造的特徴量に対する多段階の垂回帰分析による発音評価

机译:通过多步下垂回归分析对结构特征进行语音评估

获取原文
获取原文并翻译 | 示例
       

摘要

In the rapid internationalization and informatization, many research efforts have been made to build computer-aided language learning (CALL) systems. Good pronunciation assessment systems should be built using the technologies which can deal with acoustic variabilities found in learners' utterances caused by non-linguistic factors such as age and gender. However, the widely-used acoustic modeling technique of HMM often shows unstable performances with speakers of different ages and genders. Recently, a new method of representing learners' pronunciations with their non-linguistic features effectively removed, called pronunciation structure. In this method, only the contrastive features of speech are extracted. However, the excessively high dimensionality of the structure comes to degrade its performance and, to solve this problem, multilayer regression analysis with structural features is proposed in this paper. The results show much higher correlation between human and machine performances of assessing learners'.pronunciations compared to the previously proposed structure-based method. Further, the proposed method shows much higher robustness compared to the widely-used HMM-based method. In this paper, we also propose a good combination of the structure and the HMM.%国際化・情報化が急速に進む現在,コンピュータを用いた語学学習支援が盛んに研究され,教育現場に導入されている.語学学習のうち発音学習の支援には,子供から大人まで様々な声質を持つユーザにも頑健に動作する,精度の高い発音分析法が必要になる.しかし,現在広く用いられているHidden Markov Model(HMM)を利用する発音分析法では,分析結果がユーザの声質とHMMの学習データの声質のミスマッチに影響されて,分析精度の低下をもたらす.近年この間題を解決するために,声質の違いに近似的に不変な音声の構造的表象を利用した発音分析法が提案ざれ,ミスマッチに非常に高い頑健性を持つ発音分析が実現された.しかし,特にミスマッチが小さい場合,HMMを用いる手法に劣っている問題があった.本稿では,音声の構造的表象を用いた発音分析の精度を改善するために,多段階の垂回帰分析を提案する.これにより,声質のミスマッチに高い頑健性を保ったまま,ミスマッチの小さい条件でHMMを利用する場合と同等以上の精度が得られた.さらに,提案手法とHMMを用いる手法を適切に組み合わせることで,さらに良好な結果が得られた.
机译:在快速的国际化和信息化中,已经做出了许多研究努力来构建计算机辅助语言学习(CALL)系统。应当使用能够处理由于年龄和性别等非语言因素导致的学习者话语中发现的听觉变异性的技术来构建良好的语音评估系统。但是,HMM广泛使用的声学建模技术通常会在不同年龄和性别的扬声器上表现出不稳定的表现。最近,一种有效地消除了以非语言特征来表示学习者发音的新方法,称为发音结构。在这种方法中,仅提取语音的对比特征。然而,结构的尺寸过高会降低其性能,为解决这个问题,本文提出了具有结构特征的多层回归分析。结果表明,与先前提出的基于结构的方法相比,评估学习者的发音的人机性能之间的相关性更高。此外,与广泛使用的基于HMM的方法相比,该方法显示出更高的鲁棒性。本文还提出了结构和HMM的良好组合。%国际化・情报化化急速に进む现在,コンピュータを用いた语学学习支持が盛んに研究され,教育现场に引入されている。语学学习のうち発音学习の支援には,子供から大人まで様々な声质を持つユーザにも顽健に动作する,精度の高い発音分析法が必要になる。しかし,现在広く用いられているHidden Markov Model (HMM)を利用する発音分析法では,分析结果がユーザの声质とHMMの学习データの声质のミスマッチに影响されて,分析精度の低下をもたらす。近年この间题を解决するために,声质の违いに近似的に不変な音声の构造的表象を利用した発音分析法が进行ざれ,ミスマッチに非常に高い顽健性を持つ発音分析が実现された。しかし,特にミスマッチが小チがい场合,HMMを用いる手法に本稿では,音声の构造的表象を用いた発音分析の精度を改善するために,多段阶の垂回帰分析を进行する。これにより,声质のミスマッチに高い顽健性を保さらに,ミスマッチの小さい条件でHMMを利用する场合と同等以上の精度が得られた。さらに,进行手法とHMMを用いる手法を适切に组み合わせることで,さらに良好な结果が得られた。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号