...
首页> 外文期刊>電子情報通信学会論文誌 >波形接続型音声合成における素片選択遅延時間の短縮
【24h】

波形接続型音声合成における素片選択遅延時間の短縮

机译:缩短波形连接语音合成中片段选择的延迟时间

获取原文
获取原文并翻译 | 示例

摘要

波形接続型音声合成における応答遅延時間を短縮するための素片選択方法について議論を行う.波形接続型音声合成では,高品質の音声を得るために大規模な音声素片データベースが用いられることが多いが,これにより素片選択処理に要する時間も増加している.動的計画法に基づく従来の素片選択方法では,一発話全体に対する素片仮説展開を終える前に最適素片系列が決まる保証がなく,事実上,素片選択処理のパイプライン化による高速化が不可能であるが,本論文では,処理のパイプライン化を実現するため,展開仮説端までの累積コストを基準とする強制的な素片決定による素片選択方法を提案する.強制的な素片決定による素片選択結果の悪化が予想されるが,女声47.6時間の音声素片データベースを用いる音声合成システムを用いた実験では,およそ800ms先まで仮説を展開することで,従来法と同等な素片選択結果が得られた.また,素片選択結果の悪化を抑えるために,N-best仮説展開に基づく探索についても検討を行ったところ,現在の計算機性能においてそのような探索が最適となるのは,極端な短遅延設定を行った場合に限られることが明らかとなった.
机译:本文讨论了一种选择片段以减少波形级联语音合成中的响应延迟时间的方法。在波形级联的语音合成中,通常使用大型语音段数据库来获得高质量的语音,但这也增加了段选择处理所需的时间。在基于动态编程的常规片段选择方法中,不能保证在完成针对整个话语的片段假设扩展之前确定最佳片段序列,并且实际上,片段选择过程被流水线化以加速。然而,为了实现流水线处理,本文提出了一种基于强制性段确定的段选择方法,该方法基于累积成本直到扩展假设结束为止。尽管由于强制音素确定,音素选择的结果预计会变差,但是在使用语音合成系统的实验中,该系统使用女性语音的语音电话数据库进行了47.6小时的运算,但该假设被提前了约800毫秒,结果类似于该方法。另外,为了抑制段选择结果的恶化,我们还研究了基于N最佳假设扩展的搜索,并且发现由于极短的延迟设置,这种搜索在当前计算机性能中是最佳的。显然,它仅限于何时。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号