首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >任意話者の多様なスタイル生成のための話者正規化スタイル変換法の検討
【24h】

任意話者の多様なスタイル生成のための話者正規化スタイル変換法の検討

机译:研究扬声器正常化风格转换方法,适用于各种式样生成任何扬声器的

获取原文
获取原文并翻译 | 示例
       

摘要

本稿では目標話者の読上げ音声のみから所望のスタイルの音声を合成する不特定話者スタイル変換において,学習に使用した複数話者間の音響的差異による変換性能の低下を抑えるため,話者正規化学習の枠組みを変換行列の推定に導入する.不特定話者スタイル変換では,あらかじめ用意した複数話者の読上げおよび目標スタイルの音声を用いて読上げスタイルから目標スタイルへの変換行列を求め,これを目標話者の読上げスタイルのモデルに適用することで,目標話者の目標スタイルのモデルを生成する.しかし,変換行列の推定に用いる話者のスペクトル·韻律特徴が話者間で大きく異なる場合,この影響でスタイル変換において自然性が劣化してしまう.そこで提案法では,変換行列の推定の際に各話者の特徴量に対し話者適応に基づく話者正規化を行うことでこの問題を低減する.客観および主観評価にて,話者正規化が自然性改善に有効であることを示す.
机译:在本文中,在未指明的扬声器样式转换中,只能将所需的音频风格转换为目标讲话者的读取声音,扬声器定期降低由于用于学习框架的多个扬声器之间的声学​​差异而降低转换性能的下降将化学研究引入转化基质的估计中。在未指定的扬声器样式转换中,可以使用预先准备的多个扬声器的读取和目标样式,从读取样式获取从读取样式到目标样式的转换矩阵,并将其应用于目标讲话者读取的模型 - up style并生成目标谈话者的目标样式的模型。然而,如果用于估计变换矩阵的扬声器的频谱和韵律特征在很大程度上不同于扬声器之间,则由于这种效果,自然变化变化。因此,在该方法中,通过基于扬声器适应于估计变换矩阵时的扬声器适应的扬声器归一化来减少该问题。目标和主观评估表明,扬声器标准化对于自然改进是有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号