首页> 中文学位 >基于云服务的嵌入式人机语音交互系统
【6h】

基于云服务的嵌入式人机语音交互系统

代理获取

目录

声明

第一章 绪论

1.1 研究背景与意义

1.2 人机语音交互研究现状

1.3 难点及本文主要工作

1.4 论文结构安排

第二章 语音信号处理

2.1 语音信号数字模型

2.2 语音信号处理基本技术

2.3 语音定位技术

2.4 语音识别技术

2.5 语音合成技术

2.6 本章小结

第三章 多麦克风语音定位算法设计

3.1 声源定位系统设计

3.2 广义互相关时延估计算法

3.3 广义互相关算法改进

3.4 本章小结

第四章 嵌入式人机语音交互平台搭建

4.1 硬件平台搭建

4.2 系统软件平台搭建

4.3 本章小结

第五章 系统软件设计与实现

5.1 音频采样软件设计

5.2 多麦克风语音定位软件设计

5.3 云平台调用软件设计

5.4 人机语音交互软件设计

5.5 本章小节

第六章 总结与展望

6.1 总结

6.2 未来工作展望

参考文献

攻读学位期间发表的学术论文

致谢

展开▼

摘要

随着嵌入式技术的日益进步以及信息技术的快速发展,语音交互技术在嵌入式上的应用成为目前的研究热点,包括语音交互设备、语音识别、语音合成以及说话者识别等相关技术。同时深度学习和云计算技术的发展有效推动了语音交互技术的进展。为此,研究基于云服务的嵌入式人机语音交互系统的设计及其相关技术具有重要的理论意义及实用价值。
  本文在介绍语音信号处理基本技术的基础上,重点研究了基于麦克风阵列的声源定位技术,设计了平面四元十字方阵声源定位模型,推导了平面四元十字方阵基于时延参数的目标定位方程。在对广义互相关法时延估计算法分析基础上,引入了低通滤波和削波预处理以提升时延估计的性能,进而本文提出了基于线性预测残差的广义互相关算法,提升了时延估计性能。
  本文设计一个基于 TMS320DM368数字媒体处理器的嵌入式人机语音交互平台。该平台采用模块化的设计方式,主要包括主处理器模块、电源模块、存储模块、网络模块、语音采集及输出模块等。论文同时在所设计的嵌入式平台上实现了Linux操作系统以及相关驱动移植。在搭建完成的系统平台上进行了上层应用开发,实现了多路麦克风语音信号的采集,完成了所设计的基于时延估计语音定位算法的移植,设计了微软云(Microsoft Azure)接口程序实现了基于云服务的语音识别与语音合成,并实现了合成语音的播放功能。
  本文在实验室环境下对所设计的嵌入式语音交互系统进行了测试,测试结果表明所设计的语音定位算法能实现方位角和俯仰角的估计精度在10度以内,能正确完成命令字的识别、合成及播放功能,完成了智能人机交互系统的框架搭建,为后续的研究提供了基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号