首页> 外文期刊>電子情報通信学会技術研究報告 >任意の話者を対象とする統計的声質変換・制御法
【24h】

任意の話者を対象とする統計的声質変換・制御法

机译:任何说话者的统计语音质量转换和控制方法

获取原文
获取原文并翻译 | 示例
       

摘要

声質変換は,言語情報を保存したまま話者性等の非言語情報を変換する技術である.従来の統計的手法に基づく枠組みでは,入力話者と出力話者が同一内容を発声しているパラレルデータを数十文程度用いて,特定話者対を対象とした変換モデルを事前に学習する必要がある.我々は,この制約を大きく緩和する枠組みとして,任意の話者を対象とした声質変換技術の研究開発に取り組んでいる.多数の異なる話者の音声データを有効利用することで,任意の話者からある特定の話者への変換(多対一声質変換)と,ある特定の話者から任意の話者への変換(一対多声質変換)が可能となる.本報告では,これらの変換を実現する技術について紹介する.%Voice conversion (VC) is a technique to modify nonlinguistic information such as voice characteristics while keeping linguistic information unchanged. In the traditional VC framework, we need to train a conversion model for a specific input and output speaker-pair using a parallel data set consisting of dozens of utterance-pairs of those two speakers. To make VC technologies more practical, we study a novel VC framework effectively using speech samples of many different speakers for flexibly developing the conversion models for arbitrary speakers. We have hitherto proposed many-to-one VC allowing the conversion from a specific speaker's voice into an arbitrary speaker's voice and one-to-many VC vice versa. This paper describes our attempts to develop these VC technologies.
机译:语音质量转换是一种在保留语言信息的同时转换非语言信息(例如说话者特征)的技术。在基于常规统计方法的框架中,通过使用几十个并行数据的句子来预先学习针对特定讲话者对的转换模型,其中输入讲话者和输出讲话者说出相同的内容。有必要。我们正在研究和开发适用于任何扬声器的语音转换技术,以此为框架来大大放松这一限制。通过有效地使用许多不同扬声器的语音数据,从任意扬声器转换为特定扬声器(多对一语音转换)以及从特定扬声器转换为任意扬声器(一对多语音质量转换)是可能的。在此报告中,我们介绍了实现这些转换的技术。语音转换(VC)是一种在保持语言信息不变的情况下修改语音信息等非语言信息的技术。在传统的VC框架中,我们需要使用并行数据集为特定的输入和输出扬声器对训练转换模型为了使VC技术更加实用,我们有效地研究了一个新颖的VC框架,该框架使用了许多不同说话者的语音样本来灵活地开发任意说话者的转换模型。迄今为止,我们已经提出了这两个说话者的许多语音对,其中包括数十对语音对。 -一个VC允许从特定讲话者的语音转换为任意讲话者的语音,反之亦然。一对多VC反之亦然。本文介绍了我们开发这些VC技术的尝试。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号