...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >アフィン変換不変性を有する局所的特徴量を用いた音声認識
【24h】

アフィン変換不変性を有する局所的特徴量を用いた音声認識

机译:使用仿射转换不变性的局部特征进行语音识别

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では,不特定話者音声認識における音響特徴量として,アフィン変換不変性を持つ局所特徴量(Localized Affine Invariant Features; LAIF)を提案する.LAIFは,ケプストラムベクトル時系列から直接計算することができる特徴量である.話者の違いは,ケプストラムベクトルに対するアフィン変換で近似できることから,ケプストラムベクトルから抽出したLAIFは話者の違いにおよそ不変となる.そのためLAIFを用いれば,話者正規化や話者適応のための学習データがまったく得られない状況でも,話者性に頑健な音声認識を実現することができる.我々は,不特定話者の日本語孤立単語音声認識にLAIFを用いる実験を行った.実験の結果,LAIFをMFCCや△MFCCと結合して用いることにより,不特定話者音声認識の認識率を向上させることができた.特に,学習データと評価データで性別のミスマッチがある場合,MFCC+△MFCC+LAIFは,MFCC+△MFCCと比較して37%のエラー削減率を実現した.
机译:在本文中,我们提出了局部仿射不变特征(LAIF)作为未指定说话者语音识别中的声学特征。 LAIF是可以直接从Kepstram向量时间序列计算的特征量。由于说话者之间的差异可以通过对Kepstram向量的Affin变换来近似,因此从Keptrum向量中提取的LAIF对于说话者之间的差异几乎不变。因此,通过使用LAIF,即使在根本无法获得用于说话者归一化和说话者适应性的学习数据的情况下,也可以实现对说话者而言坚固的声音识别。我们使用LAIF进行了一项实验,用于未指定说话者的日语孤立单词语音识别。实验的结果是,通过将LAIF与MFCC和△MFCC结合使用,可以提高未指定说话者语音识别的识别率。特别地,当训练数据和评估数据之间存在性别不匹配时,与MFCC +△MFCC相比,MFCC +△MFCC + LAIF的错误减少率达到了37%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号