首页> 中文学位 >基于OMAP5912的嵌入式语音识别引擎的研究
【6h】

基于OMAP5912的嵌入式语音识别引擎的研究

代理获取

摘要

目前嵌入式语音识别系统多数是基于ARM、DSP或单片机开发的孤立词、特定人、小词汇量语音识别,使语音识别技术的应用受到一定的局限。本课题就是针对现有嵌入式语音识别系统的不足,在TI OMAP5912上开发中等词汇量、非特定人、连续语音识别系统。
   本文介绍了卡内基梅陇大学CMU开发的面向嵌入式终端的语音识别引擎PocketSphinx,该引擎主要包括四部分:前端语音特征参数的提取,声学模型的训练,语言模型的建立和Viterbi搜索算法。论文将特征参数提取和Viterbi搜索作为算法研究的主要对象。讨论了针对OMAP处理器双核通信专门开发的软件DSPgateway。涵盖了双核之间的通信方式,ARM和DSP端的软件开发以及DSP的加载方式。根据语音识别的特性,设定ARM端的数据传输方式为,主动发送被动接收;DSP端的数据传输方式为,主动发送主动接收,并将DSP的加载方式设定为动态加载。
   本研究在此基础上,着重讨论了针对OMAP5912处理器双核的特点,在PocketSphinx的核心算法、系统架构、模块规划、特征参数和Viterbi代码在DSP上实现所做的大量优化。采用并行处理技术,利用了DSP快速处理数字信号的特性,以及TI提供的C55x函数库,将语音识别引擎的计算密集型任务安排到DSP异步执行,极大地提高了代码的效率,降低了部分代码的繁琐复杂程度。并结合ARM的控制特性,通过双核协作建立基于嵌入式的语音识别系统。在嵌入式资源有限的环境下,本文设计的嵌入式语音识别引擎,在确保系统识别率为80[%]以上,实时性提高了0.9,为嵌入式人机语音交互系统提供了一个较好的语音识别引擎。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号