首页> 中文学位 >基于麦克风阵列的智能音视频处理系统
【6h】

基于麦克风阵列的智能音视频处理系统

代理获取

目录

声明

摘要

第一章 绪论

1.1 本文的研究背景与意义

1.2 视频监控系统研究概述

1.2.1 研究背景

1.2.2 发展现状

1.3 麦克风阵列研究概况

1.4 基于麦克风阵列的声源定位概述

1.5 论文主要工作内容及安排

2.1 引言

2.2 麦克风信号产生模型

2.3 预处理

2.3.1 归一化

2.3.2 分帧加窗

2.3.3 语音活性检测

2.4 时延估计算法研究

2.4.1 传统互相关法

2.4.2 广义互相关法

2.4.3 互功率谱相位法

2.4.4 改进的互功率谱相位法

2.5 实验对比

2.5.1 仿真实验

2.5.2 真实环境实验

2.6 本章小结

第三章 基于TDOA的声源定位技术

3.1 远场模型与近场模型

3.1.1 远场模型

3.1.2 近场模型

3.2 几何定位方法

3.2.1 角度距离定位法

3.3 解析定位方法

3.3.1 球型插值法

3.4 移动声源定位实验

3.4.1 麦克风校准

3.4.2 实验结果分析

3.5 本章小结

4.1 引言

4.2 目标检测

4.2.1 帧间差分法

4.2.2 背景差分法

4.3 目标识别

4.3.1 图像预处理

4.3.2 特征选择与提取

4.3.3 模型训练及分类

4.4 目标跟踪

4.4.1 Mean-shift跟踪方法

4.4.2 边缘调整

4.5 本章小结

第五章 基于麦克风阵列的智能音视频处理系统

5.1 系统工作流程

5.2 信号采集

5.2.1 语音信号采集

5.2.2 视频信号采集

5.3 警报设置

5.4 系统运行结果

5.5 本章小结

6.1 总结

6.2 展望

参考文献

附图

附表

致谢

攻读学位期间发表的学术论文

展开▼

摘要

智能视频监控是计算机视觉技术中最热门的应用领域之一,在金融、交通、城市安防以及军事等领域有着广泛的应用。由于摄像头存在监控“死角”和目标被障碍物遮挡等缺陷,故一些学者提出将音频信号作为视频信号的补充加入到监控系统中,起到了很好的辅助作用。相关理论算法和实用系统的研发具有较高的理论价值和广泛的应用前景。
  论文对现有的麦克风阵列声源定位和视频目标监测方法进行分析和比较,在此基础上,重点研究了基于时延估计的声源定位方法;基于实验室开发的运动目标检测、识别与跟踪实验平台,建立了一个结合麦克风阵列的视频目标监测实验系统。该系统适用于没有专人值守的室内场景,并取得了较好的实验测试效果。本文主要工作包括以下几点:
  (1)介绍了理想条件、噪声和混响条件下的麦克风阵列信号模型。深入研究了几种不同的时间延迟估计方法,提出了一种改进的互功率谱相位时延估计算法,该算法能有效地剔除不合理的时延估计结果,提高时延估计准确率。并通过仿真实验和真实环境实验验证了改进算法的有效性。
  (2)描述了阵列信号的远场模型和近场模型,介绍了几种声源定位方法的基本原理和实现步骤,着重探讨了角度距离定位法和球型插值法,在此基础上进行了移动声源定位实验,并在实验中加入麦克风校准工作,更为准确地估计声源位置信息。
  (3)对三种常用的视频目标检测方法进行了研究,介绍和分析了相关视频处理算法的原理和算法步骤。运用了形态学操作来完善目标的形状和轮廓,讨论了常见的几种特征,引入了适应于本文系统的高四分之一特征量,使用支持向量机对目标进行了训练和分类,对运动目标有着较好的识别效果。讨论了运动目标跟踪方法中的基于均值漂移的跟踪方法,并在跟踪过程中加入边缘调整功能,使得运动目标一直处于视频画面内。
  (4)搭建了一种结合音、视频信号的监控系统,适用于夜晚无人值守的室内监控。在系统运行过程中,当采集到声音信号时,便用本文改进的互功率谱时延估计算法和角度距离定位法对声音信号定位,控制球机转向此方位角。然后,系统对球机拍摄到的视频数据进行处理与分析,分别判断是否有运动目标、运动目标是否是人类,从而判断是否有异常情况出现,并启动相应的警报,为安防人员示警。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号