F0量子化と非パラレル学習に基づく声質変換の評価

太田　悠平; 能勢　隆; 小林　隆夫

首页> 外文期刊>電子情報通信学会技術研究報告 >F0量子化と非パラレル学習に基づく声質変換の評価

【24h】

F0量子化と非パラレル学習に基づく声質変換の評価

机译：基于F0量化和非并行学习的语音质量转换评估

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper describes the performance evaluation results of a context-dependent HMM-based voice conversion technique to show its effectiveness by comparing with a GMM-based one. In the HMM-based conversion, first we extract the phonetic and prosodic information from input speech of a source speaker. Then, converted synthetic speech is generated from the pre-trained acoustic model of a target speaker. To appropriately model the pitch information, we use a roughly quantized FO symbol sequence as the prosodic context instead of accent information obtained by manual labeling for training data. By using the phonetically and prosodically context-dependent HMMs, the speaker characteristics appearing in segmental and supra-segmental features can be also converted, which is difficult in conventional GMM-based techniques. Objective and subjective experimental results show that the naturalness and speaker individuality of converted speech are significantly improved by using HMM-based voice conversion.%コンテキスト依存HMMに基づく声質変換法の有効性を示すためにGMMに基づく声質変換法との比較を中心に，客観及び主観評価実験を行った結果を報告する.この手法では元話者の入力音声に対して音韻及び韻律の情報を抽出し，これらの情報に基づいてあらかじめ学習した目標話者の音響モデルから音声を生成することで声質変換を実現している.また韻律のうち，ピッチ情報を適切にモデル化するために，従来HMM音声合成で用いられていた手動ラベリングに基づくアクセント情報ではなく，学習データのF0値自体を粗く量子化したシンボルをコンテキストとして利用することで学習データに対する自動ラベリングが可能である.さらに従来提案されているGMMに基づく声質変換法では音素単位や複数の音素にわたる音響的特徴に含まれる話者の個人性を適切に変換することが困難であったのに対し，HMMに基づく手法では音韻・韻律に関わるコンテキスト依存モデルを利用することにより，このようなセグメンタル・スープラセグメンタル特徴も変換することができる.評価の結果,HMMに基づく手法を用いることにより，従来法よりも自然性が大幅に改善され，また話者性の変換においても従来を上回る結果が得られた.

机译：本文描述了一种基于上下文的基于HMM的语音转换技术的性能评估结果，通过与基于GMM的语音转换技术进行比较来显示其有效性。在基于HMM的转换中，首先，我们从源说话者的输入语音中提取语音和韵律信息。然后，根据目标说话者的预训练声学模型生成转换后的合成语音。为了适当地对音调信息建模，我们使用粗略量化的FO符号序列作为韵律情境，而不是通过手动标记训练数据而获得的重音信息。通过使用语音和语音上下文相关的HMM，还可以转换出现在分段和超分段特征中的说话人特征，这在传统的基于GMM的技术中很难实现。客观和主观的实验结果表明，通过使用基于HMM的语音转换，转换后的语音的自然性和说话人个性得到了显着改善。％比较を中心に，客観及び主観评価実験を行った结果った报告する。この手法では元话者の入力音声に対して音韵及び韵律の情报を抽出し，これらの情报に基づいてあらかじめ学习した目标话者の音响モデルから音声を生成することで声质変换を実现している。また韵律のうち，ピッチ情报を适切にモデル化するために，従来HMM音声合成で用いられていた手动ラベリングに基グにアクセント情报F，学习データのF0値自体を粗く量子化したシンボルボンテキストとして利用することで学习データに対する自动ラベリングが可能である。音素にわたる音响的特徴に含まれる话者の个人性を适切に変换することが困难であったのに対し，HMMに基づく手法では音韵・韵律に关わるコンテキスト依存モデルを利用することにより，このような评価の结果，HMMに基づく手法タ用いることにより，従来法よりも自然性が适合に改善され，また话者性の変换においても従来を上回る结果が得られた。

著录项

来源
《電子情報通信学会技術研究報告》 |2010年第376期|p.27-32|共6页
作者
太田　悠平; 能勢　隆; 小林　隆夫;
展开▼
作者单位

東京工業大学　大学院総合理工学研究科　〒226-8502　横浜市緑区長津田町4259-G2-4;

東京工業大学　大学院総合理工学研究科　〒226-8502　横浜市緑区長津田町4259-G2-4;

東京工業大学　大学院総合理工学研究科　〒226-8502　横浜市緑区長津田町4259-G2-4;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
声質変換; HMM音声合成; 韻律情報; F0量子化; GMM;

机译：声质変换;HMM音声合成;韵律情报;F0量子化;GMM;

相似文献

外文文献
中文文献
专利

1. F0量子化と非パラレル学習に基づく声質変換の評価 [J] . 太田　悠平, 能勢　隆, 小林　隆夫電子情報通信学会技術研究報告 . 2010,第373期

机译：基于F0量化和非并行学习的语音质量转换评估
2. F0量子化と非パラレル学習に基づく声質変換の評価 [J] . 太田　悠平, 能勢　隆, 小林　隆夫電子情報通信学会技術研究報告 . 2010,第375期

机译：基于F0量化和非并行学习的语音质量转换评估
3. F0量子化と非パラレル学習に基づく声質変換の評価 [J] . 太田　悠平, 能勢　隆, 小林　隆夫電子情報通信学会技術研究報告 . 2010,第374期

机译：基于F0量化和非并行学习的语音质量转换评估
4. 非負値タッカー分解によるNMF辞書学習に基づく非パラレル声質変換 [C] . 高島悠樹, 矢野肇, 中鹿亘, 日本音響学会;日本音響学会春季研究発表会 . 2018

机译：基于非负Tucker分解的NMF字典学习的非并行语音转换
5. 肝機能障害の評価法とその障害機序に関する研究; ヒト肝ミトコンドリアの日内代謝変動に基づく肝機能評価及び動物モデルを用いた肝ミトコンドリア障害機序 [D] . Iwata, Shingo 1993

机译：肝功能障碍评估方法及其机制的研究；基于人肝线粒体每日代谢变化和肝线粒体损伤机制的动物模型对肝功能的评估
6. 受動性に基づく可変スケール型とマルチラテラル型テレオペレーションシステムの構築と評価 [O] . 菅野貴皓 2013

机译：基于被动性的变尺度多边型遥操作系统的构建与评估

F0量子化と非パラレル学習に基づく声質変換の評価

摘要

著录项

相似文献

相关主题

期刊订阅