...
首页> 外文期刊>電子情報通信学会技術研究報告 >Automatic pronunciation error detecting of Chinese using SVM with structural features
【24h】

Automatic pronunciation error detecting of Chinese using SVM with structural features

机译:具有结构特征的支持向量机自动检测中文发音错误

获取原文
获取原文并翻译 | 示例
           

摘要

外国語学習者の発声には多くの発音誤りが観測される。彼らの学習を支援するCALL(Computer-Aided Language Learning)システムの構築には,発音誤り検出技術が必須である。本研究では中国語を学ぶ日本人学習者 を対象に,彼らの典型的な音素発音誤りの検出について検討した。音素誤りラベリングが施された学習者音声デー タベースの構築には多大な労力が必要となるため,ここでは母語話者音声データを操作して,人工的に,発音誤り音声データを準備した。まず,日本人にとって発音が難しい8つの音素を定義した。次に,これらの音素に関して書き起こしを操作することで,発音誤りが混入した音声データを作成した。更には故意に誤って発音した音声につ いても収録した。これらのデータを用い,GOP (Goodness of Pronunciation), LR (Likelihood Ratio),及び構造的特徴 を用いたSVM (Support Vector Machine)の三種類の方法を検討した。実験の結果,構造的特徴を用いたSVMが他の 二種類の方法よりも非常に高い精度で誤り検出ができることが示された。%Pronunciation errors are often made by learners of a foreign language. To build a CALL (Computer-Aided Language Learning) system to support them, automatic error detection is an essential technique. In this study, Japanese learners of Chinese are focused on and automatic detection of their typical and frequent phoneme production errors is investigated. Due to difficulty of preparing labels of the phoneme errors found in real learners' data, we prepare native utterances including artificial phoneme errors. First, the target phonemes, which often appear to be problematic for Japanese learners to pronounce correctly, are defined through discussion with teachers. Then, phoneme production errors are created artificially by changing transcripts of native utterances and we further ask native speakers to read sentences with specific phoneme production errors.Three methods of GOP (Goodness of Pronunciation), LR (Likelihood Ratio), and SVM (Support Vector Machine) with structural features are compared under the task of phoneme error detection. Here, GOP-based error detection is done by using the threshold optimized through development data. Results show that SVM with structural features performs better than both of the GOP-based and LR-based baseline methods.
机译:在外语学习者的话语中观察到许多发音错误。语音错误检测技术对于构建支持其学习的CALL(计算机辅助语言学习)系统是必不可少的。在这项研究中,我们研究了学习汉语的日本学习者的典型音素发音错误。由于构建带有音素错误标签的学习者语音数据库需要大量工作,因此在这里,我们通过操纵母语者的语音数据来人为地准备了错误的发音数据。首先,我们定义了八种日语难以发音的音素。接下来,通过操纵这些音素的转录,我们创建了带有发音错误的语音数据。另外,我录制了故意错误发音的声音。使用这些数据,我们研究了三种使用结构特征的方法:GOP(发音优度),LR(似然比)和SVM(支持向量机)。实验结果表明,与其他两种方法相比,使用结构特征的SVM能够以更高的精度检测错误。为了建立支持这些功能的%CALL(计算机辅助语言学习)系统,自动错误检测是必不可少的技术。在这项研究中,日语学习者专注于日语,而自动发音错误通常是由外语学习者造成的。我们调查了其典型和常见音素产生错误的检测方法,由于难以准备在实际学习者数据中发现的音素错误标签,因此我们准备了包括人工音素错误在内的自然发音。首先,目标音素经常出现问题通过与老师的讨论来定义日语学习者正确发音的方法。然后,通过改变母语发音来人为地制造音素产生错误,我们还要求母语者阅读具有特定音素产生错误的句子。发音),具有结构特征的LR(似然比)和SVM(支持向量机)在音素错误检测的任务下进行了比较。这里,基于GOP的错误检测是通过使用开发数据优化的阈值完成的。结果是,具有结构特征的SVM的性能优于基于GOP和基于LR的基线方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号