首页> 外文期刊>電子情報通信学会技術研究報告 >Phoneme Recognition based on AF-HMMs with Optimal State Configuration
【24h】

Phoneme Recognition based on AF-HMMs with Optimal State Configuration

机译:基于具有最佳状态配置的AF-HMM的音素识别

获取原文
获取原文并翻译 | 示例
       

摘要

認識と合成の双方に共通の調音運動HMM を利用する,ワンモデル音声認識・合成方式の音声認識モジュールに対して性能を改善する研究を行っている。本文では,調音特徴(AF)を用いたHMM の構成方法に焦点をあて,音素認識正解率と精度を改善するための評価実験を行った結果を報告する。種々のHMM 構成を対象に,JANAS コーパスによる評価を通して,AF に基づくアプローチは,特徴抽出器に音素文脈情報を埋め込むことで,monophone model や少ない混合数においても,高い性能を達成できることを明らかにする。%Speeh recognition based on one-model of articulatory movement HMMs that are commonly applied to both speech recognition (SR) and speech synthesis (SS) is described. In a SR module, speaker-invariant HMMs are applied to recognize articulatory feature (AF) sequence. This paper focuses on our approaches in designing an optimal state configuration for accurate phoneme recognizer based on articulatory movement. We consider several strategies to improve Articulatory Feature (AF) based phoneme recognition and compare its performance. In the experiments on Japanese Newspaper Article Sentences (JNAS) utterances, the approach of separating short vowel and long vowel in 5-states HMM triphone models provides higher accuracy compared to other approaches.
机译:我们正在进行研究,以提高一种模型的语音识别/合成语音识别模块的性能,该模块使用在识别和合成中都通用的关节式HMM。在本文中,我们重点介绍了使用发音特征(AF)构造HMM的方法,并报告了为提高音素识别的准确性和准确性而进行的评估实验的结果。通过JANAS语料库对各种HMM配置的评估,可以清楚地发现,基于AF的方法甚至可以通过在特征提取器中嵌入音素上下文信息,甚至在使用单音素模型和少量混合音的情况下也可以实现高性能。 ..描述了基于一种通常用于语音识别(SR)和语音合成(SS)的关节运动HMM的语音识别%。在SR模块中,不变说话者HMM被用于识别关节特征(AF)序列。本文重点研究基于发音运动设计准确音素识别器的最佳状态配置的方法,我们考虑了几种改进基于音素特征(AF)的音素识别并比较其性能的策略。 (JNAS)话语,在五状态HMM三音器模型中分离短元音和长元音的方法与其他方法相比具有更高的准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号