話者依存型Conditional Restricted Boltzmann Machineによる声質変換

中鹿亘; 滝口哲也; 有木康雄

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >話者依存型Conditional Restricted Boltzmann Machineによる声質変換

【24h】

話者依存型Conditional Restricted Boltzmann Machineによる声質変換

机译：話者依存型Conditional Restricted Boltzmann Machineによる声質変換

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相关主题

摘要

本研究では，元の音響特徴量空間よりも音韻性や時間変化性を抑え，話者性を強調させることによって，より入力話者音声の声質を出力話者のものへと変換しやすい話者依存空間を形成することを目的として，話者ごとにconditional restricted Boltzmann machine（CRBM）を用いた声質変換法を提案する．提案手法ではまず初めに，話者ごとに用意した学習データ（パラレルデータである必要は無い）を用いて，入力話者，出力話者のCRBMを独立に学習させる．次に，少量のパラレルデータの音響特徴量を，それぞれのCRBMを通して話者依存高次元空間へ写像（CRBMの前方推論）し，その高次特徴量同士をNeural Network（NN）を用いて変換させる．NNの変換で得られた特徴量は，CRBMの後方推論によって元の音響特徴量へ逆変換することが可能である．評価実験では，従来のGMM やNN，DBNを用いた声質変換法に比べて，主観的にも客観的にも良い精度が得られたことを確認した．

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2013年第366期|83-88|共6页
作者
中鹿亘; 滝口哲也; 有木康雄;
展开▼
作者单位

神戸大学大学院システム情報学研究科;

神戸大学自然科学系先端融合研究環;

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类电报、传真;
关键词
声質変換; Conditional restricted Boltzmann machine; Deep learning; 話者強調;

話者依存型Conditional Restricted Boltzmann Machineによる声質変換

摘要

著录项

相关主题

期刊订阅