机译:创建用于语音识别的信息的方法,用于创建语音模型的方法,语音识别方法,用于创建语音合成的信息的方法,语音合成方法,装置的参考,程序以及使用其记录的具有记录的媒体
要解决的问题:通过将STRAIGHT合成系统引入到使用HMM(隐马尔可夫模型)的语音合成系统中,使用语音识别中的参数与来自的语音合成中的参数相同,来实现高质量的简单系统配置一个文本。
解决方案:对输入的语音进行短期傅里叶变换,作为使用HMM的语音合成系统的参数,以消除基频的影响以生成STRAIGHT频谱。通过对数变换以及频率扩展和收缩离散余弦变换,将STRAIGHT频谱转换为STRAIGHT mel-cepstrum。基于STRAIGHT mel-cepstrum的参数及其学习文本来学习HMM,并将获得的HMM用于语音识别。对于语音合成,使用学习的HMM从文本合成语音。
版权:(C)2004,日本特许厅
公开/公告号JP2004012584A
专利类型
公开/公告日2004-01-15
原文格式PDF
申请/专利权人 NIPPON TELEGR & TELEPH CORP NTT;
申请/专利号JP20020162815
申请日2002-06-04
分类号G10L15/02;G10L11/00;G10L11/06;G10L13/00;G10L15/14;
国家 JP
入库时间 2022-08-21 23:34:11