首页> 外文期刊>電子情報通信学会技術研究報告 >ランダムプロジェクションを用いた音響モデルの線形変換
【24h】

ランダムプロジェクションを用いた音響モデルの線形変換

机译:使用随机投影的声学模型的线性变换

获取原文
获取原文并翻译 | 示例
           

摘要

This paper proposes a novel model adaptation method for speech recognition based on random projection. Random projection has been suggested as a means of dimensionality reduction, where the original data are projected onto a subspace using a random matrix. Moreover, as we are able to produce various random matrices, there may be some possibility of finding a transform matrix that is superior to conventional transformation matrices among these random matrices. In this paper, we adapt linear transformation to an acoustic model using random projection. Its efectiveness is confirmed by word recognition experiments on noisy speech.%本稿では,ランダムプロジェクションを用いて音響モデルの線形変換を行い,複数の特徴量を用いた音声認識を効率良く行う手法を提案する.ランダムプロジェクションとは,高次元空間における任意の2点間のユークリッド距離が射影先の低次元空間において高い確率で保存される,という性質を持つ空間写像の一手法である.また,ランダムプロジェクションで用いる写像行列は,各成分が独立にある確率分布に従うn×k行列として定義される.本稿では吉声特徴量をランダムプロジェクションを用いて変換し,ランダムプロジェクション特徴量を作成するが,得られた特徴量で音響モデルを学習するのではなく.変換前の特徴量で学習した音響モデルに対してランダムプロジェクションを行うことで,特徴量ごとの音響モデルを低コストで作成する.評価実験はCENSREC-3を用いた単語音声認識を行い,提案手法の有効性を示す.
机译:本文提出了一种新的基于随机投影的语音识别模型自适应方法,提出了一种随机投影作为降维的方法,即利用随机矩阵将原始数据投影到子空间上。在各种随机矩阵中,可能存在在这些随机矩阵中找到优于传统变换矩阵的变换矩阵的可能性。本文将线性变换应用于使用随机投影的声学模型。关于噪声噪声%本文中,我们提出了一种使用随机投影对声学模型进行线性变换并有效利用多种特征进行语音识别的方法,随机投影是在高维空间中的一种任意方法。这是一种空间映射方法,其特征在于,在投影目的地的低维空间中高概率地保留了两点之间的欧氏距离。它被定义为一个遵循分布的n×k矩阵,在本文中,正语音特征使用随机投影进行变换以创建随机投影特征,但声学模型并未使用获得的特征进行训练。通过对转换前特征学习的声学模型进行随机投影,可以低成本创建每个特征的声学模型,评估实验是使用CENSREC-3进行单词语音识别。我们展示了所提出方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号