首页> 中国专利> 一种基于信噪比权重优化更新的声源定位方法

一种基于信噪比权重优化更新的声源定位方法

摘要

本申请公开了一种基于信噪比权重优化更新的声源定位方法,用于对待检测设备中发出声响的元件进行声源定位,包括:步骤1,根据预设比例,对采集到的、声源发出的第一声音信号进行放大,并进行增益调节,生成第二声音信号;步骤2,当判定第二声音信号不是异常噪声信号时,依次计算第二声音信号对应的当前环境信噪比、以及第二声音信号的信噪比相关权重均值,并根据信噪比相关权重均值,计算参考声音传感器对应的第二声音信号的传输时延;步骤3,根据传输时延,以及声音传感器的位置坐标,计算声源的定位信息,定位信息用于对声源进行定位。通过本申请中的技术方案,能够快速准确地捕获装置发声部位的具体位置信息,实现声源的智能实时定位。

著录项

  • 公开/公告号CN112540346A

    专利类型发明专利

  • 公开/公告日2021-03-23

    原文格式PDF

  • 申请/专利权人 国网山西省电力公司大同供电公司;

    申请/专利号CN202011438854.X

  • 申请日2020-12-07

  • 分类号G01S5/22(20060101);

  • 代理机构11457 北京律谱知识产权代理事务所(普通合伙);

  • 代理人孙红颖

  • 地址 037000 山西省大同市迎宾路61号

  • 入库时间 2023-06-19 10:22:47

说明书

技术领域

本申请涉及声源定位的技术领域,具体而言,涉及一种基于信噪比权重优化更新的声源定位方法。

背景技术

噪声和异响等各种声音在日常生活、工业生产中十分常见,人耳的原始声音定位功能只是为了解决生活和生存的基本问题,定位精度非常有限。因此声源定位技术的应用就很重要,此类产品可以快速定位噪声源或异响位置,从而帮助工程师快速解决问题,大大提高工作效率。

现如今麦克风阵列已经广泛应用于语音增强、语音识别等声音信号处理领域,声源定位是确定一个声音在空间来源位置的技术,其作为基于麦克风阵列的阵列信号处理的关键技术之一,是社会的热点研究话题。

现有技术中,通常采用传统时延估计算法进行声源定位,由于室内环境下混响严重,室外环境下噪声强烈,这对定位性能造成很大影响,传统的声源定位方法在高混响强噪声和低信噪比(SNR)的环境下定位性能很差,无法满足各种实际场景中的需求。

发明内容

本申请的目的在于:快速、准确地捕获装置发声部位的具体位置信息,实现声源的智能实时定位。

本申请的技术方案是:提供了一种基于信噪比权重优化更新的声源定位方法,该方法用于对待检测设备中发出声响的元件进行声源定位,方法包括:步骤1,根据预设比例,对采集到的、声源发出的第一声音信号进行放大,并进行增益调节,生成第二声音信号,其中,第一声音信号由多个声音传感器采集;步骤2,当判定第二声音信号不是异常噪声信号时,依次计算第二声音信号对应的当前环境信噪比、以及第二声音信号的信噪比相关权重均值,并根据信噪比相关权重均值,计算参考声音传感器对应的第二声音信号的传输时延,其中,参考声音传感器包括第一声音传感器和第二声音传感器;步骤3,根据传输时延,以及声音传感器的位置坐标,计算声源的定位信息,定位信息用于对声源进行定位。

上述任一项技术方案中,进一步地,步骤2中,计算第二声音信号对应的当前环境信噪比的方法,具体包括:

步骤201,选取任意两个声音传感器作为参考声音传感器,根据参考声音传感器对应的第二声音信号,通过滤波和分窗加帧处理,计算对应的两路短时平稳信号;

步骤202,当判定两路短时平稳信号的短时能量和短时过零率均大于预设阈值时,判定两路短时平稳信号对应的第二声音信号为异常噪声信号,丢弃异常噪声信号,重新执行步骤201,否则,执行步骤203;

步骤203,判定两路短时平稳信号对应的第二声音信号不是异常噪声信号时,计算当前环境信噪比,当前环境信噪比的计算公式为:

SNR(λ)=aSNR(λ-1)+(1-a)SNR_0

式中,λ为分帧后的第二声音信号的帧数,a为平滑因子,SNR(λ-1)为上一帧的第二声音信号当前环境信噪比,SNR_0为第λ帧第二声音信号与第λ-1帧第二声音信号的能量比值。

上述任一项技术方案中,进一步地,步骤2中,信噪比相关权重至少包括:当前环境信噪比SNR(λ)、平稳信号的互功率谱密度函数、信噪比加权函数、声音信号互相关函数,信噪比相关权重的计算方法,具体包括:步骤211,对任意两声音传感器对应的第二声音信号的两路短时平稳信号,进行快速傅里叶变换,并计算互功率谱密度函数R

上述任一项技术方案中,进一步地,计算参考声音传感器对应的第二声音信号的传输时延,具体包括:步骤221,对声音传感器进行两两有序分组,记作参考声音传感器;步骤222,对每一组参考声音传感器对应的声音信号互相关函数r

上述任一项技术方案中,进一步地,声源的定位信息至少包括:声源的方位角为θ,声源的俯仰角为μ,声源到达每个声音传感器的距离。

本申请的有益效果是:

本申请中的技术方案,与相应硬件设备组合,部署于实际应用场景之中,能够快速、准确地捕获装置发声部位的具体位置信息,实现了声源的智能实时定位,具有很好的性能和推广应用前景。

本申请通过布置五元麦克风阵列进行声音采集,使用声源信号微处理器对声音信号进行二次放大操作,再利用本申请提供的结合声音信号功率值的信噪比权重函数,则可以自适应当前环境的混响与噪声,最后结合时延和位置特征对目标声源进行方位坐标的具体计算,实现声源定位。公开的方法能够在定位精度、推理速度上达到实用化的要求,实现了在前端人工智能嵌入式设备上的应用。

相比目前传统的声源定位算法,本申请结合硬件模块化设备对信号进行处理,结合机器学习、模式识别等相关算法对所采集声音信号流进行相关分析和处理,创新提出结合了声音信号功率值的信噪比权重函数,以及信噪比权重与时延特征相结合的声源定位方法,打破了常规思路,抗噪声抗混响的性能特点较为明显,实验性能明显得到提高,本申请的优势主要体现在以下两个方面:

(1)麦克风拾音能力强。本申请提出的方法通过声源信号微处理器对声音信号进行多次放大处理,从而将麦克风的输出电压扩倍,使得输入声音信号流得以满足后期信号处理的要求。

(2)抗噪声抗混响效果明显。本申请不再使用传统的时延估计算法进行声源定位,提出的方法通过对当前信噪比变化而作出相应调整,得到不同时刻不断优化更新的信噪比权重,且信噪比加权等函数均与声音信号功率值相关,提高了函数与权重值的准确性和稳定性,因此本申请可以自适应环境的噪声与混响,使得该方法在复杂嘈杂的环境中声源定位效果仍然明显且结果的准确率较高。

附图说明

本申请的上述和/或附加方面的优点在结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1是根据本申请的一个实施例的基于信噪比权重优化更新的声源定位方法的示意流程图;

图2是根据本申请的一个实施例的五元麦克风阵列结构的示意图;

图3是根据本申请的一个实施例的权重函数计算过程的示意图。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互结合。

在下面的描述中,阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。

本实施例利用五元麦克风阵列进行声音采集,采集时首先将其传输入声源信号微处理器,其中包括集成运算放大器、增益调整电位器等模块,通过对声音信号进行微处理将信号二次放大,再通过AD采集模块对五通道声音信号进行数字化转换,从而得到后续输入声音信号。之后本实施例提供一种结合声音信号功率值的信噪比权重函数,其能够随着当前信噪比变化而作出相应调整,结合信噪比权重均值、麦克风阵列时延和基础位置信息进行声源位置坐标的最终计算。

实验结果表明:本实施例中的方法与相应硬件设备组合,部署于实际应用场景之中,能够快速准确地捕获装置发声部位的具体位置信息,实现声源的智能实时定位,对室内外环境中的声源定位均具有很好的性能和推广应用前景。

如图1所示,本实施例提供了一种基于信噪比权重优化更新的声源定位方法,用于对待检测设备中发出声响的元件进行声源定位,该方法包括:

步骤1,根据预设比例,对采集到的、声源发出的第一声音信号进行放大,并进行增益调节,生成第二声音信号,其中,所述第一声音信号由多个声音传感器采集,将所述声响的元件记作所述声源。

需要说明的是,常规的全向型电容式麦克风的输出电压范围大约在0mV-60mV,这样微弱的电信号根本无法满足后期信号处理的工作,会使得实验效果不明显,定位精度较低。因此,有必要对麦克风采集的信号进行按比例放大的处理。

本实施例采用麦克风作为声音传感器,并组成五元麦克风阵列,如图2所示,以待检测设备的几何中心为原点,建立三维直角坐标系,将五元麦克风阵列中的麦克风分别标记为1、2、3、4、5号,五个麦克风1、2、3、4和5号的坐标依次为S

待检测设备运行过程中,会发出正常声响,但是,当待检测设备中的某个或某些元件发生异常时,将会导致待检测设备发出异常声响。此时,便可以将该元件作为声源,通过对声源的定位,实现待检测设备的异常检测。

因此,通过上述五元麦克风阵列,以对待检测设备的声音(包括正常声响、异常声响)进行采集,之后进入声源信号微处理器,其中包括集成运算信号放大器、增益调整电位器等模块,这里涉及的全向型电容式麦克风和所有信号处理元器件均是公知的商购器件,所有模块与元器件之间的连接方法均是本领域技术人员可以掌握的。

本实施例采用性能较为稳定的集成运算信号放大器,对所采集的第一声音信号进行按预设比例二次放大,同时引入增益调整电位器模块,使得在后期进行调试的时候,减少由于硬件特性不同而产生的精度误差。此处理器可以对声音信号进行成比例扩倍,并将其作为后续操作的第二声音信号。

步骤2,当判定所述第二声音信号不是异常噪声信号时(即当前第二声音信号为正常声音信号),计算所述第二声音信号对应的当前环境信噪比,并根据所述当前环境信噪比,计算所述第二声音信号的信噪比相关权重均值,并根据所述信噪比相关权重均值,计算参考声音传感器对应的第二声音信号的传输时延,其中,所述参考声音传感器包括第一声音传感器和第二声音传感器。

本实施例中,设定1号麦克风为第一声音传感器,5号麦克风为第二声音传感器。

具体的,如图3所示,本实施例在传统自适应信噪比权重优化的方法基础上,融入声音信号功率特征,使得权重函数深度提取声音信号的特征信息。通过五元麦克风阵列及声源信号微处理器得到增强后的五通道第二声音信号,进行声音信号预处理及一系列相关公式计算,确定当前环境信噪比、平稳信号的互功率谱密度函数、信噪比加权函数、声音信号互相关函数等信噪比相关权重。由所得信噪比相关权重,最终计算得到五路麦克风的时延特征,从而进行后续声源方位坐标的计算。

本实施例示出一种当判定所述第二声音信号不是异常噪声信号时,计算所述第二声音信号对应的当前环境信噪比的方法,具体包括:

步骤201,选取任意两个声音传感器作为所述参考声音传感器,根据所述参考声音传感器对应的第二声音信号,通过滤波和分窗加帧处理,计算对应的两路短时平稳信号。

首先将五元麦克风阵列中任意两个麦克风通道作为参考声音传感器,对参考声音传感器采集到的、进行放大和增益调节后的第二声音信号进行带通滤波处理,从而得到两路带通滤波后的声音信号。之后对得到的两路带通滤波后的声音信号,进行分窗和加帧处理,得到两路短时平稳信号。

假设所述两个麦克风采集到的声音信号为:

x

x

其中a

之后对选取的第二声音信号通过带通滤波处理,将低频段和高频段的噪声消除,为后续处理提供两路带通滤波后的声音信号。

得到上述两路带通滤波后的声音信号后,使用汉明窗函数,对所述两路带通滤波处理后的声音信号进行分帧,得到两路短时平稳信号,加窗分帧一般采用帧与帧重叠的方法。得到的两路短时平稳信号为:

s

s

其中o(n)为汉明窗函数,N为窗函数o(n)的长度,d为相邻帧之间的移位参数,λ为帧数,n为声音序列长度。

步骤202,当判定所述两路短时平稳信号的短时能量和短时过零率均大于预设阈值时,判定所述两路短时平稳信号对应的第二声音信号为异常噪声信号,丢弃所述异常噪声信号,重新执行步骤201,否则,执行步骤203。

具体的,五元麦克风阵列采集到的第一声音信号包括声音的正常信号和背景噪声信号,若声源不发声时,则采集到的声音信号仅仅是背景噪声信号(即正常噪声信号)。具体来讲,当检测的两路短时平稳信号的短时能量(声音信号一个短时间段的能量)和短时过零率(单位时间内信号波形穿过横轴(零电平)的次数)均大于预设阈值时,即可判定当前声音信号是异常噪声信号。

步骤203,判定所述两路短时平稳信号对应的第二声音信号不是异常噪声信号时,计算所述当前环境信噪比,所述当前环境信噪比的计算公式为:

SNR(λ)=aSNR(λ-1)+(1-a)SNR_0

式中,λ为分帧后的第二声音信号的帧数,a为平滑因子,SNR(λ-1)为上一帧的第二声音信号当前环境信噪比,SNR_0为第λ帧第二声音信号与第λ-1帧第二声音信号的能量比值。

进一步的,当判定所述两路短时平稳信号对应的第二声音信号是异常噪声信号时,根据上一帧第二声音信号的当前环境信噪比,更新当前帧第二声音信号的所述当前环境信噪比。

本实施例中,信噪比相关权重至少包括:当前环境信噪比SNR(λ)、平稳信号的互功率谱密度函数R

本实施例还示出一种信噪比相关权重的计算方法,具体包括:

步骤211,对任意两声音传感器对应的第二声音信号的两路短时平稳信号,进行快速傅里叶变换,并计算所述互功率谱密度函数R

式中,S

步骤212,根据所述当前环境信噪比,确定调节因子,并根据所述互功率谱密度函数R

具体的,为了抵御较大的噪声和混响影响,并且考虑到当及时经过放大处理后的第二声音信号的能量仍然存在较小的情况,在本实施例中,引入与当前环境信噪比SNR(λ)成正比关系的调节因子ρ,调节因子ρ的值是通过在声源环境的多次实验测试得出,这个值依赖当前的信噪比SNR(λ),不同的信噪比SNR(λ),调节因子ρ取不同的值,SNR(λ)越高,调节因子ρ的值就越大,一种具体的取值方式:

当SNR(λ)≤10dB时,调节因子ρ的取值范围为0.25≤ρ≤0.55;

当10dB

当30dB

因为实际环境中存在加性噪声,加性噪声是指热噪声等干扰有用信号的独立噪声,加性噪声与信号的关系是相加,不管有没有信号,加性噪声都存在。所以,在考虑加性噪声的情况下,信噪比加权函数

式中,ρ为与所述当前环境信噪比SNR(λ)成正比关系的调节因子,φ

在不考虑加性噪声的情况下,信噪比加权函数

式中,ρ为与所述当前环境信噪比SNR(λ)成正比关系的调节因子,φ

本实施例中,为了保证声源定位的准确性,考虑实际环境中的加性噪声,因此,信噪比加权函数

步骤213,计算所述互功率谱密度函数R

式中,α所表示意思为针对所选窗函数时域中每一帧长进行累加计算的次数。

本实施例在计算参考声音传感器对应的第二声音信号的传输时延时,具体包括:

步骤221,对声音传感器进行两两有序分组,记作所述参考声音传感器;

步骤222,对每一组参考声音传感器对应的声音信号互相关函数r

步骤223,将抽样点与抽样点间隔时间相乘,生成参考声音传感器对应的第二声音信号的预计时延;

步骤224,采用循环遍历算法,对每一组参考声音传感器重复执行步骤221至步骤224,计算所述预计时延的均值,记作所述传输时延。

具体的,五元麦克风阵列的麦克风分为1、2、3、4、5号,五个麦克风1、2、3、4和5号的坐标以此为S

将上述五个麦克风每2个为一组,共十组,循环遍历每一组并通过上述步骤221至步骤224,最终可以得到传输时延。

设定1号麦克风对应第一声音传感器,5号麦克风对应第二声音传感器,通过上述过程采用遍历的方式,可以计算出声源到达麦克风2、3、4、5号的时间相对于1号的传输时延τ

步骤3,根据所述传输时延,以及所述声音传感器的位置坐标,对所述声源进行定位。

设定声源的方位角为θ,声源的俯仰角为μ,声源到达每个麦克风(声音传感器)的距离分别为z

式中,z

以上结合附图详细说明了本申请的技术方案,本申请提出了一种基于信噪比权重优化更新的声源定位方法,用于对待检测设备中发出声响的元件进行声源定位,包括:步骤1,根据预设比例,对采集到的、声源发出的第一声音信号进行放大,并进行增益调节,生成第二声音信号;步骤2,当判定第二声音信号不是异常噪声信号时,依次计算第二声音信号对应的当前环境信噪比、以及第二声音信号的信噪比相关权重均值,并根据信噪比相关权重均值,计算参考声音传感器对应的第二声音信号的传输时延;步骤3,根据传输时延,以及声音传感器的位置坐标,计算声源的定位信息,定位信息用于对声源进行定位。通过本申请中的技术方案,能够快速准确地捕获装置发声部位的具体位置信息,实现声源的智能实时定位。

本申请中的步骤可根据实际需求进行顺序调整、合并和删减。

本申请装置中的单元可根据实际需求进行合并、划分和删减。

尽管参考附图详地公开了本申请,但应理解的是,这些描述仅仅是示例性的,并非用来限制本申请的应用。本申请的保护范围由附加权利要求限定,并可包括在不脱离本申请保护范围和精神的情况下针对发明所作的各种变型、改型及等效方案。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号