...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >[ポスター講演]読み上げ音声を利用したニューラルネットワークに基づく歌唱者非依存歌声変換の検討
【24h】

[ポスター講演]読み上げ音声を利用したニューラルネットワークに基づく歌唱者非依存歌声変換の検討

机译:[海报讲座]基于神经网络的朗读语音测试与歌手无关的歌声转换

获取原文
获取原文并翻译 | 示例
           

摘要

従来の声質変換手法は元話者の音声を用いた事前学習が必要であるという問題点がある.我々はこれを解決する手法として,複数の元話者と目標話者間で多対一マッピングを行うニューラルネットワークを用いることで任意の入力話者の話者性を特定の目標話者へ近づける手法を提案した.さらにこの手法では,変換に差分スペクトルフィルタを用いることでより自然性の高い変換音声が得られる.この研究では読み上げ音声の変換を対象として評価しているが,カラオケなどへの応用を考えると歌声の変換についても検討する必要がある.提案手法を歌声変換に適用する際に,本来であればニューラルネットワークの学習に歌唱音声を用いることが妥当であると考えられるが,そのためには学習に用いる大量の歌唱者のパラレルな歌唱音声の収録が必要となり,読み上げ音声と比較して非常にコストが高い.そこで本稿では,読み上げ音声を学習に利用したニューラルネットワークに基づく歌唱者非依存歌声変換について検討する.評価実験により,学習に歌唱音声を用いた歌唱者依存の手法より自然性の高い変換歌唱音声が得られること,複数の歌唱者から単一の目標歌唱者への多対一変換が行えることを示す.
机译:常规的语音质量转换方法具有需要使用原始讲话者的语音进行事先学习的问题。作为解决此问题的方法,我们使用神经网络在多个原始说话者和目标说话者之间执行多对一映射,以使任何输入说话者的说话者特征更接近特定的目标说话者。被提出。此外,在该方法中,通过使用差谱滤波器进行转换,可以获得更自然的转换声音。在本研究中,虽然评估了朗读语音的转换,但是考虑到在卡拉OK等方面的应用,有必要考虑唱歌语音的转换。当将所提出的方法应用于歌声转换时,使用歌声来学习神经网络被认为是适当的,但是为此目的,大量歌手的并行歌声用于学习。需要录制,并且与朗读语音相比,成本很高。因此,在本文中,我们研究了基于独立于歌手的歌声转换,该转换基于使用阅读语音进行学习的神经网络。通过评估实验,发现与使用歌手进行学习的歌手相关方法相比,可以获得更自然的转换歌手声音,并且可以执行从多个歌手到单个目标歌手的多对一转换。显示。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号