...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >短遅延素片選択におけるビーム幅制御の検討
【24h】

短遅延素片選択におけるビーム幅制御の検討

机译:短延迟元件选择中的光束宽度控制检查

获取原文
获取原文并翻译 | 示例
           

摘要

素片接続型音声合成システムにおいて短遅延時間の音声合成を実現するため、ビームサーチにおけるビーム幅の制御手法を導入する。先行研究において幅優先探索に基づく短遅延素片選択アルゴリズムが検討されたが、そこでは、素片選択処理は常に実時間で行われ、仮説展開の深さは常に一定であると仮定していた。しかし、仮説展開が浅い場合はビーム幅を大きくしてもその効果は小さく、むしろ仮説が深い方が、より良い索片選択結果を得ることができる。 従って、ビーム幅を小さくすることで実時間よりもさらに高速な素片選択を行い、仮説の探さを徐々に深くしていく方法が考えられる。 本研究では、女声13時間の音声コーパスから構築した音声索片デ夕べ-スを用い、各時刻において考慮する索片候補数を500、ビームサーチのビーム幅を200として素片選択を行う場合について検討した。 そして、初期遅延時間が200ェ11SeCの場合について、決定索片から800msec先まで仮説が展開されるまではビーム幅を200より小さいある一定値とする、という制御を行ったところ、その最適な場合において、従来方法による索片選択結果に近いコスト値の索片選択結果が得られた。
机译:为了在逐段语音合成系统中以短的延迟时间实现语音合成,将介绍波束搜索中的波束宽度控制方法。在先前的研究中,研究了一种基于宽度优先搜索的短延迟元素选择算法,其中假定元素选择过程始终实时进行,并且假设发展的深度始终恒定。然而,当假设发展较浅时,即使波束宽度增加,效果也很小,相反,假设越深,可获得的帘线选择结果越好。因此,可以想像地减少波束宽度以比实时更快地选择元素,并逐渐加深对假设的搜索。在这项研究中,我们使用由13小时的女性话语语料库构建的语音线数据库,并每次选择500个候选线和200个波束宽度进行波束搜索。调查。然后,在初始延迟时间为200 e11 SeC的情况下,执行控制以将光束宽度保持在小于200的某个值,直到将假设从确定的帘线片发展到800毫秒为止。以上,获得了成本值接近于通过传统方法的帘线选择结果的帘线选择结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号