首页> 中文学位 >基于可控功率响应的声源定位快速算法研究
【6h】

基于可控功率响应的声源定位快速算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 基于麦克风阵列声源定位方法的概述

1.2.1 基于高分辨率谱估计的声源定位方法

1.2.2 基于时延差估计的声源定位方法

1.2.3 基于可控波束的声源定位方法

1.3 论文的主要工作与结构安排

第二章 声源定位基础及仿真

2.1 信号接收模型

2.1.1 理想自由声场

2.1.2 混响声场

2.1.3 近场与远场

2.2 房间脉冲响应的仿真

2.3 广义互相关声源定位方法

2.4 可控功率响应声源定位方法

2.4.1 理论基础

2.4.2 SRP-PHAT算法实现

2.5 本章小结

第三章 三线快速SRP定位算法

3.1 空间功率谱(极坐标描述)

3.2 三线快速SRP定位算法

3.3 算法复杂度分析

3.4 仿真实验

3.4.1 仿真实验环境

3.4.2 性能评估标准

3.4.3 TIMIT语音库数据仿真实验结果及分析

3.4.4 真实环境数据仿真及分析

3.5 本章小结

第四章 基于时延差聚类的快速SRP算法

4.1 空间功率谱(球坐标二维描述)

4.2 基于时延差聚类的快速SRP算法

4.3 聚类基本概念

4.4 聚类算法

4.4.1 k-means聚类算法

4.4.2 k-medoids聚类算法

4.4.3 isodata聚类算法

4.4.4 GMM聚类算法

4.4.5 谱聚类算法

4.4.6 层次聚类

4.5 算法复杂度分析

4.6 仿真实验

4.6.1 实验环境

4.6.2 性能评估标准

4.6.3 仿真结果与分析

4.6.4 真实环境数据仿真及分析

4.7 本章小结

第五章 总结与展望

5.1 全文总结

5.2 下一步工作展望

致谢

参考文献

攻读硕士学位期间参加的科研项目和完成的论文

展开▼

摘要

麦克风阵列声源定位是利用麦克风组成的阵列来估计声源位置的技术,在日常生产与生活中有着广泛的应用。声源定位算法一般分为基于高分辨率谱估计,基于时延差估计和基于可控波束形成三大类,可控功率响应(SRP:SteeredResponsePower)算法是典型的基于可控波束的声源定位方法,在混响环境中具有较强的稳健性,但复杂的计算量限制了它在实时环境中的应用。因此,本文的研究目标就是在保持定位性能基本不变的前提下,减少SRP的计算量。
   首先,介绍了传统SRP算法的原理,并做了一系列仿真实验,包括用Image算法仿真了房间脉冲响应,直观地演示了混响;仿真广义互相关(GCC:GeneralizedCrossCorrelation)算法,说明GCC由于麦克风个数较少,只能确定声源的一系列候选位置,且性能随混响增加而急剧下降;仿真传统SRP算法,直观演示了定位的结果,说明其在强混响环境中也能取得较好的定位效果。
   其次,给出了三线快速SRP算法。该算法是一个由粗到精的声源搜索过程,在粗搜索阶段,估计出水平偏角和大致的径向距离,从径向距离中可以判断声源处于近场还是远场,在精搜索阶段则根据近远场采用不同的策略进一步搜索声源可能出现的位置。分析计算复杂度,三线快速SRP有效地减少了一个维度的计算量。TIMIT语音库的数据仿真和真实环境的数据仿真表明,三线快速SRP算法与传统SRP算法有着相当的定位性能。
   最后,给出了基于时延差聚类的快速SRP算法,着重讨论了六种不同的聚类算法,分别是:k-means,k-medoids,isodata,GMM,谱聚类和层次聚类。该算法分成三个步骤:第一步是对时延差聚类,可以离线完成;第二步是对声源位置粗搜索,实际上就是分别计算所有聚类中心的SRP功率值,功率值最大的聚类即为声源可能存在的目标区域;第三步是在目标区域内对声源位置精搜索。分析计算复杂度,基于时延差聚类快速SRP的计算量比传统SRP的计算量要小很多。TIMIT语音库的数据仿真和真实环境的数据仿真表明,基于时延差聚类的快速SRP算法总能获得与传统SRP算法几乎不变的定位性能,对时延差进行谱聚类还会提升仰角的估计性能。
   综上所述,两种快速SRP算法都极大地减少了所需的计算量,从而有效地提高了SRP用于实时定位的可能性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号