首页> 中文会议>2003年通信理论与信号处理年会 >一种用于声道长度归一化的频率折叠技术

一种用于声道长度归一化的频率折叠技术

摘要

本文提出了一种新的VTLN方法.首先基于不同人群的平均第三共振峰求得频率折叠因子,采用双线性变换对Mel滤波器组的位置和宽度进行折叠,从而获得声道归一化的特征矢量.该方法避免了对折叠因子α的线性搜索,同时还利用了双线性变换使折叠的频谱连续且无带宽改变的优点.在元音和孤立洞的识别中对该方法进行了性能测试,并和非线性频率折叠和巴克双线性变换法进行了比较.结果表明用本文的声道长度归一化技术对MFCC参数进行变换后,男性元音样本训练的基线系统对女性元音数据的识别率提高了11.67﹪;男性青年的语音样本训练的基线系统对女性青年和儿童的孤立词识别率分别增加了19.5﹪和13﹪.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号