首页> 外国专利> Compressing and using a concatenative speech database in text-to-speech systems

Compressing and using a concatenative speech database in text-to-speech systems

机译:在文本到语音系统中压缩和使用连接语音数据库

摘要

A method and apparatus are provided for compressing and using a concatenative speech database in TTS systems to improve the quality of speech output generated by handheld TTS systems by allowing synthesis to occur on the client. According to one embodiment of the present invention, a G.723 encoder receives diphone waveforms, and compresses them into diphone residuals. While compressing the diphone waveforms, the encoder generates Linear Predictive Coding (LPC) coefficients. The diphone residuals, and the encoder-generated LPC coefficients are then stored in encoder-generated compressed packet.
机译:提供了一种用于压缩和使用TTS系统中的级联语音数据库以通过允许在客户端上进行合成来改善由手持式TTS系统生成的语音输出的质量的方法和装置。根据本发明的一个实施例,G.723编码器接收双音素波形,并将其压缩为双音素残差。在压缩diphone波形时,编码器会生成线性预测编码(LPC)系数。然后将双音素残差和编码器生成的LPC系数存储在编码器生成的压缩数据包中。

著录项

  • 公开/公告号US7035794B2

    专利类型

  • 公开/公告日2006-04-25

    原文格式PDF

  • 申请/专利权人 SUDHEER SIRIVARA;

    申请/专利号US20010822547

  • 发明设计人 SUDHEER SIRIVARA;

    申请日2001-03-30

  • 分类号G10L19/04;

  • 国家 US

  • 入库时间 2022-08-21 21:42:40

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号