【24h】

Language model adaptation using auto-induced semantic structures in a voice search system

机译:在语音搜索系统中使用自动诱导的语义结构进行语言模型自适应

获取原文

摘要

In this paper, we study how to generate in-domain data for statistical language model adaptation in a Chinese voice search dialogue system. Given limited amount of in-domain data, we use unsupervised clustering to induce semantic classes and structures from the first part of test data. These structures arc further augmented with domain information to generate large amount of in-domain data. Lastly we test on the second part of test data and get a improvement of speech recognition for 6.2%.
机译:在本文中,我们研究了如何为中文语音搜索对话系统中的统计语言模型自适应生成域内数据。给定有限的域内数据量,我们使用无监督聚类从测试数据的第一部分中引入语义类和结构。这些结构进一步增加了域信息,以生成大量域内数据。最后,我们对测试数据的第二部分进行测试,语音识别能力提高了6.2%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号