自然な歌声合成システムを構築するためには,基本周波数(F0)やスペクトル形状,音韻長といった物理的な特徴を適切に制御することが重要である.本論文では,話声と歌声を比較検討することで歌声知覚に影響を与える心理的特徴ならびに物理的特徴を明らかにし,STRAIGHT (Kawahara et al.,1999)を利用して話声から歌声に変換する方法を提案する.この方法ま,歌声のF0変化を生成するためのF0制御モデルと,話声のスペクトル形状を変形するためのスペクトル制御モデル,リズムに基づいた音韻長制御モデルの三つのモデルで構成される.提案法がオリジナルの歌声と同じくらい自然な歌声を話声から変換し,合成できることを示した.
展开▼