首页> 外文会议>2015 3rd International Conference on Control, Engineering amp; Information Technology >Framework for VOIP speech database generation and a comparaison of different features extraction methodes for speaker identification on VOIP
【24h】

Framework for VOIP speech database generation and a comparaison of different features extraction methodes for speaker identification on VOIP

机译:VOIP语音数据库生成框架以及用于VOIP的说话人识别的不同特征提取方法的比较

获取原文
获取原文并翻译 | 示例

摘要

This paper presents a framework for VOIP database generation and an investigation of the impact of VOIP characteristics on the accuracy of automatic speaker identification system. Exactly we study the impact of G711 and iLBC codec, and the influence of packet loss. A set of experiments are done on the generated databases to find the best feature extraction method for speaker identification on VOIP. The acoustic features considered are the most commonly used ones: MFCCs, LPCs and PLPs. Speaker models used in this study are based on Gaussian Mixture models and are implemented using HTK. VOIP databases used for training and testing are created using Asterisk.
机译:本文提供了一个用于VOIP数据库生成的框架,并研究了VOIP特性对自动说话人识别系统准确性的影响。确实,我们研究了G711和iLBC编解码器的影响以及丢包的影响。在生成的数据库上进行了一组实验,以找到用于VOIP上说话者识别的最佳特征提取方法。所考虑的声学特征是最常用的声学特征:MFCC,LPC和PLP。本研究中使用的扬声器模型基于高斯混合模型,并使用HTK实现。用于培训和测试的VOIP数据库是使用Asterisk创建的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号