首页> 外文OA文献 >Speaker identification using time-delay HMEs.
【2h】

Speaker identification using time-delay HMEs.

机译:使用延时HmE识别说话者。

摘要

In this paper, we extend the Hierarchical Mixture of Experts (HME) to temporal processing and explore it for a substantial problem, that of text-dependent speaker identification. For a specific multiway classification, we propose a generalized Bernoulli density instead of the multinomial logit density to avoid the instability during training. Time-delay technique is applied for spatio-temporal processing in the HME and a combining scheme is presented for combining multiple time-delay HMEs in order to complete a multi-scale analysis for the temporal data. Using the time-delay HME along with the EM algorithm as well as the combination of multiple time-delay HMEs, the speaker identification system has a good performance and yields significantly fast training. We have also addressed some issues about the time-delay techniques in the HME.
机译:在本文中,我们将专家分层混合系统(HME)扩展到时间处理,并针对一个实质性问题(与文本相关的说话人识别问题)进行探讨。对于特定的多路分类,我们提出了广义的伯努利密度而不是多项式对数密度,以避免训练过程中的不稳定。将时延技术应用于HME中的时空处理,并提出了一种用于组合多个时延HME的组合方案,以完成对时间数据的多尺度分析。结合使用时延HME和EM算法以及多个时延HME的组合,说话人识别系统具有良好的性能,并且训练速度非常快。我们还解决了有关HME中的延时技术的一些问题。

著录项

  • 作者

    Chen K.; Xie D.; Chi H.;

  • 作者单位
  • 年度 1996
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号