首页> 外文期刊>IEICE Transactions on Information and Systems >The Nitech-NAIST HMM-Based Speech Synthesis System for the Blizzard Challenge 2006
【24h】

The Nitech-NAIST HMM-Based Speech Synthesis System for the Blizzard Challenge 2006

机译:基于Nitech-NAIST HMM的语音合成系统,用于2006年暴雪挑战赛

获取原文
获取原文并翻译 | 示例
       

摘要

We describe a statistical parametric speech synthesis system developed by a joint group from the Nagoya Institute of Technology (Nitech) and the Nara Institute of Science and Technology (NAIST) for the annual open evaluation of text-to-speech synthesis systems named Blizzard Challenge 2006. To improve our 2005 system (Nitech-HTS 2005), we investigated new features such as mel-generalized cepstrum-based line spectral pairs (MGC-LSPs), maximum likelihood linear transform (MLLT), and a full covariance global variance (GV) probability density function (pdf). A combination of mel-cepstral coefficients, MLLT, and full covariance GV pdf scored highest in subjective listening tests, and the 2006 system performed significantly better than the 2005 system. The Blizzard Challenge 2006 evaluations show that Nitech-NAIST-HTS 2006 is competitive even when working with relatively large speech databases.
机译:我们描述了由名古屋工业大学(Nitech)和奈良科学技术学院(NAIST)的联合小组开发的统计参数语音合成系统,该系统用于名为“暴雪挑战2006”的文本到语音合成系统的年度开放评估。为了改善我们的2005年系统(Nitech-HTS 2005),我们研究了一些新功能,例如基于mel广义倒频谱的线谱对(MGC-LSPs),最大似然线性变换(MLLT)和全协方差全局方差(GV) )概率密度函数(pdf)。 mel-倒谱系数,MLLT和完整协方差GV pdf的组合在主观听力测试中得分最高,2006系统的性能明显优于2005系统。暴雪挑战2006的评估表明,即使使用相对较大的语音数据库,Nitech-NAIST-HTS 2006也具有竞争力。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号