首页> 中文学位 >基于多麦克风的语音技术研究及其在会议系统中的应用
【6h】

基于多麦克风的语音技术研究及其在会议系统中的应用

代理获取

目录

文摘

英文文摘

独创性(或创新性)声明及关于论文使用授权的说明

第一章概述

1.1研究背景

1.2文章内容安排

第二章语音数字信号处理和阵列信号处理基本理论

2.1语音数字信号处理基础

2.1.1语音信号产生数学模型

2.1.2语音信号特点小结

2.1.3语音信号数字处理中的短时分析技术

2.1.4一些基本的语音参数

2.1.5带噪语音模型

2.2阵列信号处理原理

2.2.1常规波束成形器原理

2.2.2信号的窄带表示方式

2.2.3自适应波束成形器

第三章语音信号定位算法

3.1子空间的概念和基于子空间定位算法的一般形式

3.2窄带多目标分类MUSIC算法

3.3宽带语音信号的MUSIC定位算法

3.3.1阵列会聚原理

3.3.2远场情况下的语音信号定位算法

3.3.3近场情况下的语音信号定位算法

3.4仿真和分析

3.4.1远场情况仿真

3.4.2近场情况仿真

3.5小结

第四章语音检测方案

4.1常用的语音检测(VAD)算法

4.1.1基于短时能量门限的方法

4.1.2基于过零率的方法

4.1.3基于基音周期检测的方法

4.2新的几何自适应能量门限法(GAET)

4.3会议环境的噪声分析

4.4语音联合检测方案

4.5仿真试验

第五章利用自适应波束成形器进行语音增强

5.1广义自适应旁瓣抵消器GSC

5.2 GSC在噪声环境下的性能分析

5.3 GSC算法在语音增强中的应用

5.4实验及其结果

第六章系统方案

6.1硬件方案

6.2软件方案

参考文献

致谢

展开▼

摘要

随着网络技术及微处理技术的发展,视频会议系统作为一种有效和经济的沟通方式为越来越多的人所采纳.它要求为用户提供高质量的音视频源及音视频同步的服务.而实际的会议环境由于各种原因总是存在着很多噪声干扰,它们会随着网络传送到会议的另一端,从而大大降低语音质量.另外在视频会议中,我们通常要求将视频画面聚焦到发言者,而通常的办法是通过人工旋转对焦摄像镜头的方式来进行的,但这样往往造成操作滞后,使传送到远端的视频画面和音频信号不同步.因此研究如何对噪声进行抑制和实现自动控制摄像头是十分必要的.该文研究了如何利用多麦克风阵列来实现语音增强和快速音源定位.论文主要包括对语音检测算法,基于多目标分类(MUSIC)的定位算法及自适应语音增强算法的研究.论文讨论了上述算法的基本原理,同时针对会议系统的特点研究了它们的改进形式、实现方法以及在不同的情况下的性能.为了研究的完整性,该文还给出了一个完整的系统实现方案.仿真和实际典型环境的试验都表明算法的合理性和稳定性,可作为开发实用视频会议系统的基础.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号