...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >ランダムプロジェクションを用いた音響モデルの線形変換
【24h】

ランダムプロジェクションを用いた音響モデルの線形変換

机译:使用随机投影的声学模型的线性变换

获取原文
获取原文并翻译 | 示例

摘要

本稿では,ランダムプロジェクションを用いて音響モデルの線形変換を行い,複数の特徴量を用いた音声認識を効率良く行う手法を提案する.ランダムプロジェクションとは,高次元空間における任意の2点間のユークリッド距離が射影先の低次元空間において高い確率で保存される,という性質を持つ空間写像の一手法である.また,ランダムプロジェクションで用いる写像行列は,各成分が独立にある確率分布に従うn×k行列として定義される.本稿では音声特徴量をランダムプロジェクションを用いて変換し,ランダムプロジェクション特徴量を作成するが,得られた特徴量で音響モデルを学習するのではなく,変換前の特徴量で学習した音響モデルに対してランダムプロジェクションを行うことで,特徴量ごとの音響モデルを低コストで作成する.評価実験はCENSREC-3を用いた単語音声認識を行い,提案手法の有効性を示す.
机译:在本文中,我们提出了一种通过使用随机投影对声学模型进行线性变换来有效利用多个特征量执行语音识别的方法。随机投影是一种空间映射方法,其特征在于,在投影目标的低维空间中高概率地保留高维空间中任意两点之间的欧几里得距离。另外,将随机投影中使用的映射矩阵定义为n×k矩阵,其中每个分量独立遵循一定的概率分布。在本文中,使用随机投影对语音特征量进行转换以创建随机投影特征量,但是不是使用通过获取的特征量来学习声学模型,而是使用在转换之前通过特征量来学习的声学模型。通过执行随机投影,可以低成本创建每个特征量的声学模型。在评估实验中,使用CENSREC-3进行单词语音识别以证明所提方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号