首页> 外文期刊>電子情報通信学会技術研究報告 >声道断面積関数を用いたGMMに基づく歌唱音声の声質変換
【24h】

声道断面積関数を用いたGMMに基づく歌唱音声の声質変換

机译:基于声道截面函数的基于GMM的歌声语音质量转换

获取原文
获取原文并翻译 | 示例
       

摘要

This paper describes GMM voice conversion of singing voice using the vocal tract area function. The conventional methods mostly use the mel-cepstrum as a feature vector. However, the converted spectral envelope in this case can sometimes be unnatural. This unnatural spectral envelope degrades naturalness of the generated sounds. Therefore, we propose the method using the vocal tract area ratio and pre-emphasis filter based on the LPC analysis. The proposed method can alleviate a problem that frequencies of spectral peaks and dips of the generated spectrum mismatch that of target spectrum. As a result of the subjective evaluation of naturalness and speaker individuality, it was found that the speaker individuality of the proposed method is comparable to that of the conventional method.%本稿では声道断面積関数を用いたGMMに基づく歌唱音声の声質変換について報告する.従来法では学習と変換に用いる特徴量はメルケプストラムが主流である.しかしこの場合,変換後のスペクトル包絡が不自然になり,合成音声の品質が劣化することがある.この問題を解決するため,LPC分析に基づく声道断面積比と高域強調特性を特徴量として用いる手法を提案した.提案法により,従来法で見られた変換音声と目標音声のスペクトルの山と谷の不一致の問題が改善される傾向が見られた.また提案法と従来法に対し,自然性と話者性に関する主観評価を行った結果,話者性に関して従来法と同程度の品質が得られることが分かった.
机译:本文描述了利用声道面积函数对歌唱声音进行GMM语音转换,传统方法大多以mel倒谱为特征向量,但是这种情况下转换后的频谱包络有时可能是不自然的,这种不自然的频谱包络会降低自然度。因此,我们提出了基于LPC分析的使用声道面积比和预加重滤波器的方法,该方法可以缓解频谱峰值和频谱的频率与目标频谱不匹配的问题。通过对主观自然性和说话人个性的主观评估结果,发现所提出方法的说话人个性与传统方法相当。%本文采用基于GMM的声道横截面函数进行歌唱我们报告语音的语音质量转换。在传统方法中,梅尔倒谱是用于学习和转换的功能的主流。然而,在这种情况下,转换后的频谱包络变得不自然,并且合成语音的质量可能劣化。为了解决这个问题,我们提出了一种基于LPC分析的以声道横截面积比和高频强调特性为特征的方法。所提出的方法趋于改善转换语音和目标语音的频谱的峰谷之间的不匹配的问题,这在常规方法中已经看到。另外,作为所提出的方法和常规方法关于自然性和说话者特性的主观评价的结果,发现就说话者特性而言获得了与常规方法相同的质量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号