首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >話者依存型Conditional Restricted Boltzmann Machineによる声質変換
【24h】

話者依存型Conditional Restricted Boltzmann Machineによる声質変換

机译:話者依存型Conditional Restricted Boltzmann Machineによる声質変換

获取原文
获取原文并翻译 | 示例
           

摘要

本研究では,元の音響特徴量空間よりも音韻性や時間変化性を抑え,話者性を強調させることによって,より入力話者音声の声質を出力話者のものへと変換しやすい話者依存空間を形成することを目的として,話者ごとにconditional restricted Boltzmann machine(CRBM)を用いた声質変換法を提案する.提案手法ではまず初めに,話者ごとに用意した学習データ(パラレルデータである必要は無い)を用いて,入力話者,出力話者のCRBMを独立に学習させる.次に,少量のパラレルデータの音響特徴量を,それぞれのCRBMを通して話者依存高次元空間へ写像(CRBMの前方推論)し,その高次特徴量同士をNeural Network(NN)を用いて変換させる.NNの変換で得られた特徴量は,CRBMの後方推論によって元の音響特徴量へ逆変換することが可能である.評価実験では,従来のGMM やNN,DBNを用いた声質変換法に比べて,主観的にも客観的にも良い精度が得られたことを確認した.

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号