本稿では,音声についての言語的な明瞭性ではなく,聴感的印象(本研究では聴いた印象が「はきはき」「もごもご」していることを対象とする)の制御に向けた取り組みについて述べる.本研究の目的は,所謂音声明瞭度·了解度のような言語情報の書き取りで生じる差ではなく,会話が可能な程度に明瞭であるものの,聴取者に与える印象が異なる場合を対象とした差の評価·制御にある.これまでの検討により,発話中の口の動きが聴感的印象に関連することが確認されたので,本稿では,聴感的印象を改善するための声質変換を実現するための検討を行う.ここでは,口の動きに対応する制御パラメタを明らかにするため,音声モーフィングによりいくつかのパラメタを段階的に変化させ,主観評価により聴感的印象の評価を行うこととした.はきはき話す声ともごもご話す声を対象に,声道断面積関数(Vocal tract area function:VTAF),残差スペクトル,F0,非周期性指標それぞれについて独立してモーフィングを行うことで聴感的印象に対応する特徴量を調査する.実験の結果,残差スペクトルとVATFが聴感的印象に強く影響することが確認され,FOと非周期性指標には影響されないことが明らかとなうた.本結果は,聴感的印象はスペクトル包絡の特徴のみで制御可能であることを示唆するものである.
展开▼