首页> 中文期刊> 《电子测量技术 》 >基于LPBMFCC的文本无关说话人识别

基于LPBMFCC的文本无关说话人识别

             

摘要

为了解决特定说话人的高频信息无法被完全提取的问题,提出了一种新型的提取声道特征的方法,用于文本无关的说话人识别。首先提出了一组基于线性预测的梅尔频率倒谱系数(LPBMFCC)来消除干扰听觉能力的高频谐波,以区分两种不同的纯音,导出具有辨识性的声道特征。此外,提出利用多尺度小波分析来提取声源语音信号的时频特征作为LPBMFCC的补充特征。为了研究LPBMFCC和其他特征在说话人识别应用中的辨识能力,提出了一种基于距离测量的辨识力比较方案,可以在视觉上表示不同声学特征的分散。在基于高斯混合模型(GMM)的说话者识别系统的NIST 2008数据库上进行评估。实验结果表明,提出的LPBMFCC特征具有较强的辨识能力,与一些先进的方法相比,识别率高出5%~10%。而加入时频特征作为补充特征的LPBMFCC的识别率与不加时频特征时相比,识别率又有1%~4%的提高。因此,本文所提的方法具有更加优越的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号