...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >韻律的に多重な音声データベースを活用した韻律制御時の品質劣化低減手法の検討
【24h】

韻律的に多重な音声データベースを活用した韻律制御時の品質劣化低減手法の検討

机译:建设性多音频数据库利用韵律控制期间质量劣化减少方法

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

本報告では,TTS (Text-To-Speech)システムを用いて,多様な発話スタイルを表現する音声合成手法の検討を行う.多様な発話スタイルの音声を生成するためには,自由に周波数特性,韻律を制御する必要があるが,ここでは韻律 (基本周波数F{sub}0,音素声続時間)に着目し,標準的な音声 (以下,normal),F{sub}0の高い音声(high),F{sub}0の低い音声(low),発話速度の速い音声 (fast),発話速度の遅い音声(slow)を柔軟かつ高品質に生成することを目的とする.本稿では,波形接続型テキスト音声合成における韻律制御時の品質劣化に着目する.まず韻律的に多重な音声データべースを用いることにより,韻律変更量を削減し,品質劣化を低減する手法の検討を行った.その結果,韻律の変更量削減がF{sub}0·音素持続時間の観点から有効に行われ,high, low, slowの合成音声において品質が向上した.次に各韻律傾向 (normal, high, low, fast, slow)における韻律変形の方向と品質劣化との関係を知覚的に評価した.そしてこの知覚評価の結果を利用し,韻律変形の方向とその品質劣化を考慮した韻律に関するサブコスト関数を作成した.提案コスト関数の有効性を検証した.結果,normal, low, fast, slowの合成音声において品質が向上した.
机译:在本报告中,我们使用TTS(文本到语音)系统来检查代表各种语音样式的语音合成方法。为了产生各种语音风格的语音,有必要自由控制频率特性和rusodoids,但我们专注于韵律(基本频率f {sub} 0,音素语音时间)和标准语音(下文中称为正常) ,f {sub} 0高音(高),f {sub} 0低音(低),语音(快)语音(快速)的语音(慢速)的语音(慢速)的语音速度,它旨在具有灵活且高质量的。在本文中,我们专注于波形连接型文本语音合成中韵律控制中的质量恶化。首先,通过使用Procipty语音数据库,通过降低韵律变化和降低质量降解来研究。结果,从音素持续时间的角度有效地进行了韵律的变化量,并且质量高,较低,合成慢的言论。接下来,感知韵律趋势的韵律变形方向与质量劣化之间的关系(正常,高,低,快速,慢)。然后,使用这种感知评估的结果,考虑韵律变形方向及其质量恶化的韵律的子变频功能。验证了拟议的成本职能的有效性。因此,质量在正常,低,快速,慢的合成语音中得到改善。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号