首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >Deep Learningに基づく音声特徴量の有限状態トランスデューサ型識別モデルによる識別
【24h】

Deep Learningに基づく音声特徴量の有限状態トランスデューサ型識別モデルによる識別

机译:基于深度学习的有限状态传感器类型识别模型识别语音特征

获取原文
获取原文并翻译 | 示例
           

摘要

2層よりも多くの隠れ層を持つ多層パーセプトロンは局所最適解やプラトーの問題から,有効な解を得ることが困難であったため,従来あまり利用されてこなかった.しかし近年,教師なしニューラルネットワークの技術を援用した最適化技術等に代表される,多層パーセプトロン学習法(ディープラーニング技術)の進展によって,有効な解を得ることが可能であることが実験的に示され,再注目されてきている.隠れ層を多数用意することの利点は,単一の隠れ層より複雑な非線形変換をより少ないユニット数で学習できる点にあると言われている.すなわち,ディープラーニングの技術は音声特徴量を線形識別可能な表現に変換するモデルをより高精度に学習する手法であると考えることができる.他方では,近年,音声認識のプロセスを線形識別とみなすことで,高精度な音声認識を行なう構造識別と呼ばれる手法も注目を集めている.これら構造識別法は,出力の直接最適化という面で有望であるが,非線形の特徴変換を前処理として適用しておくことが重要である.これらを踏まえ,本稿では前処理としての特徴量変換に,多くの隠れ層を持つ多層パーセプトロンを利用し,そのようにして得た線形識別可能な音響特徴量を構造識別モデルで識別することを考える.
机译:过去,具有两个以上隐藏层的多层感知器尚未广泛使用,因为由于局部最优解和平稳问题而难以获得有效的解。然而,近年来,已经通过实验证明,通过以使用无监督神经网络技术的优化技术为代表的多层感知器学习方法(深度学习技术)的进步,可以获得有效的解决方案。已经重新集中。据说准备大量隐藏层的好处是,与单个隐藏层相比,可以用更少的单元学习更复杂的非线性变换。换句话说,深度学习技术可以被认为是一种学习模型的方法,该模型可以将语音特征转换为具有更高准确性的线性可识别表示形式。另一方面,近年来,通过将语音识别过程视为线性识别来执行高精度语音识别的称为结构识别的方法也引起了关注。这些结构识别方法在直接输出优化方面很有前途,但是将非线性特征变换用作预处理很重要。基于这些,在本文中,我们考虑将具有许多隐藏层的多层感知器用于特征量转换作为预处理,并以结构识别模型识别以此方式获得的线性可识别声学特征量。 ..

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号