【24h】

Prior Information for Rapid Speaker Adaptation

机译:快速适应说话者的先决信息

获取原文

摘要

Rapidly adapting a speech recognition system to new speakers using a small amount of adaptation data is important to improve initial user experience. In this paper, a count-smoothing framework for incorporating prior information is extended to allow for the use of different forms of dynamic prior and improve the robustness of transform estimation on small amounts of data. Prior information is obtained from existing rapid adaptation techniques like VTLN and PCMLLR. Results using VTLN as a dynamic prior for CMLLR estimation show that transforms estimated on just one utterance can yield relative gains of 15% and 46% over a baseline gender independent model on two tasks.
机译:使用少量的适应性数据将语音识别系统快速适应新的说话者,对于改善初始用户体验非常重要。在本文中,扩展了用于合并先验信息的计数平滑框架,以允许使用不同形式的动态先验,并提高了对少量数据的变换估计的鲁棒性。从现有的快速适应技术(如VTLN和PCMLLR)中获取先验信息。使用VTLN作为CMLLR估计的动态先验的结果表明,仅凭一种话语估计的变换就可以在两项任务的基准性别无关模型上产生15%和46%的相对收益。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号