首页> 中国专利> 并行推断多声源方向及监测各移动声源声级的方法和装置

并行推断多声源方向及监测各移动声源声级的方法和装置

摘要

对一个或多个声源(101)获得包括相应角度方向在内信息的方法和装置,包括一声源方向推断部(1l6),用于对麦克风阵列的输出信号进行频域和时域处理以得到每一声源连续的推定角度方向。一经过检测部(216)可利用该推定方向检测声源何时正好移动通过该麦克风阵列以及实现这种经过检测时该声源的方向,以及一运动速度检测部(609),用连续获得的推定方向并靠这种经过检测触发来运算所通过声源的速度。此外,能够产生麦克风阵列的方位来面向正移动通过麦克风阵列的声源的方向,而能够准确监测相应声源的声级。

著录项

  • 公开/公告号CN1300042A

    专利类型发明专利

  • 公开/公告日2001-06-20

    原文格式PDF

  • 申请/专利权人 松下电器产业株式会社;

    申请/专利号CN00136425.1

  • 发明设计人 水岛考一郎;

    申请日2000-12-14

  • 分类号G08G1/01;

  • 代理机构上海专利商标事务所;

  • 代理人赵国华

  • 地址 日本国大阪府

  • 入库时间 2023-12-17 13:54:28

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2010-02-10

    专利权的终止(未缴年费专利权终止)

    专利权的终止(未缴年费专利权终止)

  • 2006-07-19

    授权

    授权

  • 2001-06-20

    公开

    公开

  • 2001-05-09

    实质审查请求的生效

    实质审查请求的生效

说明书

本发明涉及一种推断一个或多个声源分别相对于特定位置的角方向的方法和装置,而且涉及利用这种推定的方向检测移动声源何时移动经过一特定的角方向并监测多个移动声源中相应一个所发出声音的方法和装置。

日本专利特公平5-114098号公报说明了一种推断声源角方向并监测声源的方法。图22示出该现有技术声源方向推断装置的组成。图22中,第一和第二定向麦克风901和902沿交通流量线以固定距离L为间隔设置。分别由这些麦克风收集的声音,可称之为交通噪声A和交通噪声B,分别经放大电路903、904放大,所生成的信号由一转换电路905交替选择,在定时控制电路910控制下,连续地由频率分析电路906进行频率分析。由此分别得到频率向量分布SA和SB,与交通噪声A和交通噪声B相对应。接下来检测频率向量分布SA和SB之间的近似度,并由时间差检测电路908求得频率向量分布SA和SB变得近乎一致的点之间的时间差dt。时间差/速度变换电路909接着执行下列运算

V=L/dt来判定声源速度,并由显示电路911显示该速度值。另外,可根据上述时间差计算声源方向。象这样利用现有技术方法,便能够推断声源角方向并监测该声源所发出的声音。

但利用这种现有的声源方向推断方法,当多个声源的声音同时到达麦克风或除了所希望监测的声源以外还有一声源时,推断声源方向的准确性便降低。

下面说明书和所附的权利要求书中,术语“方向”除非用来指角运动方向或线性运动方向,否则应理解为“相对于特定原点的角方位”这种意义。

本发明目的在于,解决现有技术上述问题,提供一种即便附近有多个声源、或除了所需要声源以外还有另一不同类型的声源时,也能准确推断相对于特定点的声源方向的方法和装置。

另一目的在于,提供一种可并行推断多个声源各自方向的方法和装置。

再有一目的在于,提供一种利用上述所推定的方向检测声源何时移动经过相对于固定位置的特定方向,并因此检测出移动通过那特定位置的声源的方法和装置。

另有一目的在于,提供一种利用上述所推定方向检测声源是否运动,若运动检测运动方向和速度的方法和装置。

还有一目的在于,提供一种利用上述所推定方向使特定声源所发出声音能够得到监测的方法和装置。

为了实现得到一个或多个声源推断方向的目的,利用本发明的声源方向推断方法和装置,在每一相应的时间窗内提取麦克风阵列的输入信号,同时在每一时间窗内对固定频率组当中的每一频率运算相应声源的推定方向,这样运算出的方向的平均,便成为与该时间窗相对应的推定方向。由于基于多个频率获得声源的推定方向,因而可实现声源方向推断较高的准确度。

为了进一步提高声源方向推断的准确性,与如上所述对一时间窗获得每一按频率平均的推定方向一样,运算对该时间窗得到的推定方向和对该时间窗之前固定的多个时间窗运算好的相应推定方向之间的平均,由此(对每一连续的时间窗)获得一基于频率平均和时间平均这两者的推定方向。

而且,按照本实施例的声源方向推断方法和装置,可通过检测分别处于一固定的方向范围内并出现在一固定观察间隙内的对该声源所获得推定方向的个数超过一预定最小个数,来判别声源方向是否通过一特定方向,并生成表示经过检测结果的数据来表明该情况。这样便能够检测一移动声源当前正通过麦克风阵列。

此外,按照本发明这样一种声源方向推断方法和装置,便能够当生成一与声源相对应的经过检测结果时,根据分别在生成经过检测结果时刻和之前对声源得到的推定方向之间差值的符号,来判别声源的运动方向。例如,可将连续得到的推定方向组临时设置到数据缓存器中,从而当得到一经过检测结果时,缓存器内容会包含生成该经过检测结果之前得到的推定方向。作为替代,通过采用得到该经过检测结果之后所获得的推定方向,也能够达到同样效果。

而且,若已知该麦克风阵列和移动声源流的运动路线之间的距离,便可用生成与该声源相对应的经过检测结果的时刻,采用该推定方向来推断声源运动的(线)速度。具体来说,可测定对该声源得到的推定方向移动通过一特定量所花的时间,或一预定时间间隙内该推定方向的变化量,由此获得该声源相对于该麦克风阵列的角速度。该声源的大致线速度因此可根据至声源运动线路的距离来运算。

此外,按照本发明方法和装置,可配置为当检测出声源当前正移动通过麦克风阵列(如一经过检测结果所示),便对该麦克风阵列建立一沿最近获得的该声源的推定方向对齐的方位。若该麦克风阵列是一固定的线型阵列,便可通过对相应的麦克风输出信号加合适的延迟量并将该延迟的信号累加来有选择地建立在大约180°范围以内的方位,该生成信号构成一传达该特定声源所发出声音的监测信号。

作为替代,可预先规定该麦克风阵列的多个固定方位。在这种情况下,当对一声源获得一经过检测结果时,可采用该声源的当前推定方向来选择规定方位中最接近该推定方向的方位,监测这样执行后的该声源所发出的声音。在这种情况下,由于无需每当开始监测时建立一新的麦克风阵列方位,因而能够监测按各种基本上不同速度移动的声源(进而会与检测到声源通过时对每一声源得到的推定方向基本上有所不同)。

附图简要说明

图1是用于说明第一实施例连续得到相对于麦克风阵列的一个或多个声源各自推定方向这一基本特征的概要图;

图2A和2B组成的是第一实施例中利用基于频率和基于时间这两者的平均处理在连续的时间窗中得到所推定方向的声源方向推断部第一组成的总体系统框图;

图3A和3B组成的是声源方向推断部第一组成所执行的处理步骤的流程图;

图4A和4B组成的是第一实施例中仅利用基于频率的平均处理在连续的时间窗中得到所推定方向的声源方向推断部第二组成的总体系统框图;

图5A和5B组成的是声源方向推断部第二组成所执行的处理步骤的流程图;

图6是具有声源方向推断部和用于检测移动声源何时移动经过相对于麦克风阵列特定方向的通过检测部的第二实施例的总体系统框图;

图7是第二实施例所执行处理步骤的流程图;

图8是包括声源方向推断部、通过检测部在内,获取并向一记录装置提供表示从当前移动通过麦克风阵列的特定声源接收到的声音能级的数据的第三实施例的总体系统框图;

图9是第三实施例所执行处理步骤的流程图;

图10是包括声源方向推断部在内,起到检测固定声源存在的第四实施例的总体系统框图;

图11是包括声源方向推断部、通过检测部和运动方向求出部在内,求出表示当前移动通过麦克风阵列的声源运动方向的数据的第五实施例的总体系统框图;

图12是第五实施例所执行处理步骤的流程图;

图13是包括速度检测部用于对通过检测部得到的通过检测结果和声源方向推断部得到的推定方向运算得到当前移动通过麦克风阵列的声源的速度的第六实施例的总体系统框图;

图14是第六实施例所执行处理步骤的流程图;

图15是包括定向性控制部用于对通过检测部得到的通过检测结果和声源方向推断部得到的推定方向运算用以设定麦克风阵列的定向性以便监测通过的声源的第七实施例的总体系统框图;

图16是第七实施例所执行处理步骤的流程图;

图17是包括定向性控制部用于对通过检测结果和推定方向运算用以选择监测通过的声源所发出声音的麦克风阵列的多个规定定向性其中一个的第八实施例的总体系统框图;

图18是第八实施例所执行处理步骤的流程图;

图19是用于说明第八实施例工作原理的概要图;

图20是用于说明监测沿运动方向相反的两条相邻路径移动的声源其声级的第八实施例经修改组成的概要图;

图21是与图20相对应的部分流程图;以及

图22是利用麦克风检测移动声源方向的现有装置的总体系统框图。

(第一实施例)

先参照图1中概要图说明本发明第一实施例的基本特征。图1中,标号101表示按箭头所示方向沿一路径95例如公路90行进的诸如汽车这样一种声源(如平面图所示)。多个麦克风组成的线型阵列102按与路径平行的阵列方向邻近路径95设置。阵列102中麦克风各自的输出信号送至一声源方向推断部116,这里对该信号进行处理以检测出一个或多个声源,例如在所示的方向推断范围内按箭头方向沿路径95移动的声源101,其中每一个的连续方向(相对于作为原点的特定点,诸如麦克风阵列102的中央麦克风这种位置而言)。

令声源的每一方向表示为相对于一正中方向(图1中表示为0°的方向)的角位移,每一方向均表示为相对于该正中方向具有正或负的角位移。如上所述,单独使用用语“方向”这种用法是指一角度值,以便与声源的“运动方向”这种用语,例如图1中声源101其用箭头所示的线性运动方向相区别。

声源方向推断部116能够获得可能在例如+90°至-90°或+45°至-45°范围内对声源推定的方向。但可以限制这种方位范围(按方位角表示)来消除外部噪声源的干扰,并且还可以相同原因在仰角方面对方位范围加以限制。

下面参照图2A、图2B中总体框图更为详细地说明第一实施例的组成。这里,声源101和麦克风阵列102与图1中具有相同标号的部分相对应。图2A、图2B中,麦克风阵列102由按规则间隔d隔开的M个麦克风所组成。麦克风阵列102各自的输出信号分别经声源方向推断部116中M个波形提取部103传送至M个频率分析仪104。对特定频率组中的每一频率来说,由该频率分析仪104得到相应的复数振幅矩阵。相关矩阵运算部107对每一这种复数振幅矩阵得到相应的相关矩阵。由本征向量运算部108对每一这种相关矩阵(例如与一特定频率值相对应的每一矩阵)进行操作来运算相对应的本征向量组。本征向量运算部108将运算出的本征向量送至一噪声分量矩阵运算部109,由此得到的每一噪声分量矩阵(也与一特定频率相对应)送至方向/功率关系运算部110。多个方向控制向量从方向控制向量运算部106输出,也送至方向/功率关系运算部110。

方向/功率关系运算部110所生成的输出值,与一方向范围设定部111所生成的表示一预定方向范围的数据一起,送至超范围值剔除部112。超范围值剔除部112所生成的输出值送至频基平均部113,而所生成的输出值则送至时基平均部114。该时基平均部114所生成的平均结果输出值表示各声源相应的推定方向,即,这些构成声源方向推断部116所生成的输出数据。

本实施例如下运作。麦克风阵列102由沿一直线并按规则间隔d配置的M个麦克风所组成。这些M个麦克风的输出信号在各个时间窗中由波形提取部103周期性地提取,每一时间窗具有一持续时间W。该时间窗形状可以是矩形,或作为替代可采用诸如汉明窗那种形状,其中使得振幅在窗的相对两端更小。若使得时间窗长度W相对较小,便会降低准确性,而使得W相对较大的话,便不大可能跟踪移动迅速的声源。这样,时间窗长度W必须根据对要监测其声音的声源所预见的运动速度进行相应的选择。例如,在推断按每一小时40km的速度移动并且其运动路径距麦克风阵列102的距离L等于10米的声源这种情况下,时间窗长度W其合适值在2至10ms范围内。另外,提取时间其合适值(即时间窗的重复周期)会在W/2至2W范围内。

在每一时间窗,频率分析仪104对波形提取部103所提取的每一组麦克风信号部分(可当作各自时间轴信号部分)进行操作,来运算多组复数振幅值,这些组中的每一组,与上面提及的预定组频率值其中一个频率值相对应。可用FFT(快速傅里叶变换)法来运算复数振幅值,或作为替代,若必须对此进行运算的频率数目相对较少,也可应用DFT(离散傅里叶变换)法。

接下来,就每一上述频率组运算每一相应方向所接收到的声音功率值(用所接收到的信号功率来表示)。若一频率其波长小于麦克风阵列102相邻麦克风间隔d的2倍数值,则频率越高,推断准确性越高。由于这种原因,实用中所具有的波长值在2d至10d范围内的频率较为合适。对某些特定频率,运算复数振幅矩阵,这由下面式(1)表示为向量X[m]。

X[m]=[x1,x2,……,xM]T            式(1)

其中,xm(m=1~M)是对那特定频率根据麦克风阵列所生成的m个输出信号运算出的各自复数振幅,上标T表示X[m]是矩阵[x1,x2,……,xM]的转置。接下来,应用下面式(2)来运算相应的相关矩阵107,表示为矩阵R[m,m]:

R[m,m]=X[m]·X[m]H               式(2)

其中m=1~M。这里,上标H表示转置复数共轭。本征向量运算部108接着运算与相关矩阵R[m,m]相对应的本征向量组v1[m],v2[m],……,vM[m](其中m取数值1~M)。

因为矩阵R[m,m]是厄米矩阵,可利用本技术领域公知的Householder法对边缘向量进行运算,将矩阵R变换为对称的3重对角矩阵,再应用(也是本技术领域公知的)QL法得到本征向量。

噪声分量矩阵运算部109接着利用下面式(3)运算与麦克风输出信号的噪声分量相对应的噪声分量矩阵Rn[m,m],假定有K个声源,K为整数。 >>>R>n>>[>m>,>m>]>=>>ν>>k>+>1>>>[>m>]>·>>>ν>>k>+>1>>>>>[>m>]>>H>>+>>ν>>k>+>2>>>[>m>]>·>>>ν>>k>+>2>>>>>[>m>]>>H>>+>·>·>·>·>·>·>>+>>ν>M>>[>m>]>.>>ν>M>>>>[>m>]>>H>>>s>  式(3)

上述表达式假定,声源数目K小于麦克风阵列102中麦克风总数,即不大于M-1。若无法预先推断声源数目,便应设定K等于M-1。

接下来,为了推断相应方向接收到的声音功率相应值,运算预定的多个方向θ中每一方向相应的方向控制向量,其中这些方向中每一方向是角方向,相对于麦克风阵列上某一点来表示。每一方向控制向量作为一列向量d[m]由下面式(4)求出: >>d>[>m>]>=>>>[>1>,>>e>>->jωτ>>>,>>e>>->j>>ω>2>>τ>>>,>.>.>.>.>.>.>,>>e>>->j>>ω>>(>M>->1>)>>>τ>>>]>>T>>>s>     式(4)

这里,τ由下面式(5)定义,其中c表示声音速度。

τ=(dsinθ)/c                    式(5)

方向/功率关系运算部110对每一方向θ按下面式(6)运算相应的功率值P(θ)。

P(θ)=1/(d[m]H·Rn[m,m]·d[m])   式(6)

通常方向θ的集合会覆盖-90°至+90°角范围。

这样,对上面提及的预定频率组以外的某一频率,便得到与声源不同方向相对应的所接收到的声音功率的相应值。

接下来确定方向θmax,即得到所接收到的声音功率P(θ)为最大值的方向。若θmax处于方向范围设定部111所设定数值范围之外,超范围值剔除部112便将其从推定的方向值当中剔除。若预先知道该装置所要检测的声源其可能的位置范围,方向范围设定部111便根据该可能的位置范围来设定上述数值范围。

按上面所述程序,利用特定时间窗内测定的频率,可对该特定频率运算声源的推定方向。对于该相同时间窗,对上面提及的频率组中的每一频率均重复该程序。接着(即由频基平均部113)就对于频率值全集得到的相应推定方向θmax的集合取平均,以便象利用一个特定时间窗那样得到声源的推定方向。

随着频基平均部113连续得到上述推定方向,将它们存储到时基平均部1114中的缓存器,它能够保持预定数目的推定方向数值。每当频基平均部113即对某一特定时间窗新得到一推定方向,便读出当前保持在缓存器中的推定方向集合,运算上述推定方向与最近得到的推定方向合在一起的平均。

这样,便根据多个连续时间窗得到的结果,得出由时基平均部114所生成的每一推定的声源方向。

象这样按照本发明实施例,利用时间窗周期性提取来自麦克风阵列的信号,在每一时间窗内,利用由多个频率得到的各自推定方向的平均值得出推定方向,得出每一这种推定方向时,将它与前面多个时间窗中同样得到的推定方向合在一起取平均,来通过在频域和时域两者内进行平均,得出一准确的推定声源方向。

上面假定了某一时刻仅对一个声源得出一推定方向的情形,即每一时间窗周期所要检测的是单个声音功率最大值,与该最大值相对应方向作为θmax得出的情形。但通常某一时刻在麦克风阵列102的定向范围内会有多个声源(例如汽车)。在此情况下,可就每一这种声源,即根据将上述式(6)连续应用于每一方向θ所得到的系列结果,来获得相对于方向而言所接收到的信号功率各自的局域最大值。这样,便能够就某一时间窗,作为与每一声音功率局域最大值相对应的相应方向,并行获得多个推定方向,例如θmax1、θmax2等。

下面先参照图4中总体系统框图来说明本实施例的替代组成。其由麦克风阵列102、波形提取部103、频率分析仪104、相关矩阵运算部107、方向控制向量运算部106以及频基平均部113(其中各自的功能和组成如同就图2A、图2B示出的实施例方式所作的说明那样),与方向/功率关系运算部208一起组成。第一实施例这种方式在以下方面与图2A、图2B中的有所不同。首先,方向/功率关系运算部208直接操作如上所述相关矩阵运算部107对特定频率(结合方向控制向量运算部106所生成的方向控制向量组)生成的每一相关矩阵,来得出一方向θmax,即在该特定频率获得所接收到的声音功率P(θ)为最大值的方向。其次,仅对推定的方向执行基于频率的平均,以(每一时间窗)获得最终输出的声源推定方向。

如上所述,对于每一上面提及的预定组的频率值,通过频率分析仪104对来自阵列102中相应麦克风的一组经提取的音频信号部分加以处理,得出相应的复数振幅矩阵,该矩阵可表示为如上面式(1)所示的向量X[m]。接着,对每一这种复数振幅矩阵,由相关矩阵运算部107利用上面式(2)运算出相应的相关矩阵,即,将相关矩阵表示为R[m,m]。另外,由方向控制向量运算部106利用上面式(4)对多个方向θ得出方向控制向量组d[m],并送至方向/功率关系运算部208。

方向/功率关系运算部208接着利用下面式(7),运算出对于某一特定频率多个方向θ中每一方向(即,举例来说处于+90°至-90°角度范围的方向)的声音功率P(θ):

P(θ)=d[m]H·Rn[m,m]·d[m]    式(7)

从而确定某一特定频率下得到最大声音功率级的方向θmax。

对每一上面提及的预定频率组重复上述程序。接着由频基平均部113得出对各个频率得到的相应方向θmax的平均,以(对特定时间窗)获得声源的推定方向。

图5A、图5B中流程图示出与上面相对应的处理步骤。

(第二实施例)

首先参照图6中总体系统框图来说明本发明的第二实施例。图6中,麦克风阵列102和声源方向推断部116对具有第一实施例相应标号的部分来说,具有上面说明的相应功能和组成。声源方向推断部116可具有如图2A、图2B所示的第一组成,由此根据跨多个连续时间窗应用基于频率的平均和基于时间的平均来得出每一输出推定的方向,或者可具有图4所示的替代组成,仅应用基于频率的平均。由声源方向推断部116将表示声源相应推定方向的数据送至一经过检测部216的范围内发生数目运算部212,还包括方向范围设定部211和经过检测判别部213。范围内发生数目运算部212所生成的、将被指定为经过检测范围Pn的表示预定方向范围的数据,也送至经过检测判别部213。该规定方向范围Pn落在整个范围(例如从-90°至+90°)内,也不会超出该整个范围,在该整个范围内声源方向推断部116可得出推定方向,图6中该整个范围表示为从初始方向θr延续至结束方向θf。由此作为经过检测判别部213的输出,即表示声源当前正经过麦克风阵列102的数据,得到表示经过检测结果的数据。

具体来说,范围内发生数目运算部212,在第一次得到声源在范围Pn内的推定方向时所开始的预定N个连续时间窗期间,运算出声源推定方向处于经过检测范围Pn内的次数。令该次数为n,n超出预定的基准水平nt的话,经过检测判别部213便判别声源已经通过范围Pn(具体来说,至少已经通过该范围的初始方向),故而生成表示经过检测结果的数据,表明声源当前正通过麦克风阵列102。

时间窗个数N的合适值和基准值nt将取决于对声源可预期的近似运动速度,和声源路径距麦克风阵列102的距离L。若举例来说,L为10米,预期声源运动速度大约为40公里/小时的话,时间窗个数N的数值在10至40范围内和基准水平nt数值大约为5至10是比较合适的。

图7是一例可用来执行本实施例操作的算法的流程图。为了简化该流程图,虽然实际上往往不会发生,但假定每一时间窗都获得一推定方向。如图所示,当步骤S3中判别所推定的声源方向进入方向范围设定部211所规定的经过检测范围Pn时,即声源已到达或超出图6所示的方向θr时,便分别启动将要与时间窗个数N和阈值nt相比较的计数值m和n的递增。发现如此时,便重复执行步骤S5至S11的循环,直到发现达到连续的时间窗个数N前已达到范围内推定方向的阈值个数nt或虽未达到阈值个数nt却达到时间窗个数N为止。

如上所述的第二实施例组成意图应用于沿单一方向,即沿图6中声源101行进路径上箭头所示方向行进的声源。在对相邻并行路径但方向相反(例如双向街道上)行进的声源进行经过检测的情形下,会利用单个麦克风阵列102,但会如下面结合第八实施例所作的说明那样,提供一第二经过检测部216来检测在第二运动方向上行进通过的声源。

(第三实施例)

下面参照图8中总体系统框图来说明第三实施例。如图所示,由麦克风阵列102、声源方向推断部116和经过检测部216,同数据缓存器307、数据提取部308以及记录装置309在一起组成。声源方向推断部116可具有图2A、图2B中所示的第一组成,由此可根据跨多个连续时间窗应用基于频率的平均和基于时间的平均来得出每一输出推定的方向,或者可具有图4所示的替代组成,仅应用基于频率的平均。经过检测部216具有上面对先前实施例所说明的组成和运作。

本实施例如下运作。表示各自经过检测结果的数据从经过检测部216送至数据提取部308,将阵列102其中某一个麦克风(假定为第1号阵列位置上的麦克风)所生成的音频信号送至数据缓存器307,即作为连续的数字数据取样。(为了便于说明,图中省略了将麦克风输出信号变换为数字信号的模拟-数字变换器)。这可等效于利用超过一个麦克风其输出信号的组合。当经过检测结果送至数据提取部308时,通过读出数据缓存器307中当前保持的数据并将该数据送至记录装置309加以记录进行响应。

缓存器307的容量是任一时刻该缓存器在一特定时间间隙Tb内所生成的音频数据量。当数据提取部308接收到的经过检测结果表明声源正通过麦克风阵列102时,该数据提取部308便读出数据缓存器307的内容,并将这些内容送至记录装置309进行记录。那样,表示当前正通过麦克风阵列102的声源在时间间隙持续期间Tb并延续至获得经过检测结果的时刻所发出声音的信号便送至记录装置309。因此,随其移动通过麦克风阵列102,可获得并记录移动声源在一特定时间间隙期间所生成的声音。

象这样按照本实施例,可与第二实施例同样推断声源方向,并检测该声源的通过,另外,可利用至少一个麦克风的输出信号来监测并记录正通过的声源所生成的声音,并依靠经过检测结果的生成来触发这些运作。

图9流程图中示出上述运作的处理步骤。

(第四实施例)

下面先参照图10中总体系统框图来说明第四实施例。如图所示,由麦克风阵列102和声源方向推断部116,同移动平均运算部405、变化量运算部406以及固定声源检测部407所组成的固定声源求出部408在一起组成。声源方向推断部116可具有图2A、图2B中所示的第一组成,由此可根据跨多个连续时间窗应用基于频率的平均和基于时间的平均来得出每一输出推定的方向,或者可具有图4所示的替代组成,仅应用基于频率的平均。

声源方向推断部116输出的表示所生成的相应推定方向的数据,输入到固定声源求出部408中移动平均运算部405和变化量运算部406中的每一个。移动平均运算部405和变化量运算部406的相应输出输入到固定声源检测器407。当检测出有固定声源出现时,固定声源检测器407生成表明该检测结果的输出数据。

固定声源检测部408中,移动平均运算部405在每一连续的固定持续期间的观察间隙内运算出声源方向推断部116所生成的连续声源推定方向组的移动平均,变化量运算部406运算该连续推定方向的变化量。若发现所运算出的变化量低于基准值,固定声源检测器407便判别该声源是固定的。若发现所推定方向的移动平均处于声源可能方向预定范围之外的话,便舍弃该相应变化量值。

这样,固定声源检测器407便能可靠地检测出麦克风阵列102定向范围内有固定声源出现。另外,当检测出这种情形发生时声源方向推断部116所生成的推定方向表示该固定声源的方向。

(第五实施例)

下面参照图11中总体系统框图和图12中流程图来说明第五实施例。实施例由每一个都如上面对先前实施例中相应标号的部分所作的说明那样运作的麦克风阵列102、声源方向推断部116和经过检测部216,以及运动方向求出部509所组成。该运动方向求出部509由推定方向缓存器505、经过前方向求出部506、经过后方向求出部507和运动方向检测部508所组成。按对第二实施例说明的相同方式,声源方向推断部116在连续时间窗中所获得的推定方向送至经过检测部216,每当检测到声源进入经过检测范围Pn时便由经过检测部216生成一经过检测结果。运动方向求出部509中,推定方向缓存器505配置成具有与合适个数的连续获得的推定方向相对应的存储容量。

当经过检测部216生成表示经过检测结果的数据(如图11中Pd所示)时,该数据被送至经过前方向求出部506和经过后方向求出部507。经过后方向求出部507通过将最近一次设置进入缓存器505中的推定方向或经过检测部216所生成的最近一次获得的推定方向传送至运动方向检测部508进行响应。经过前方向求出部506通过将赶在经过后方向求出部507所传送的推定方向之前获得的推定方向,诸如缓存器505内容中最老的推定方向,传送至运动方向检测部508,来响应经过检测结果。令经过前方向推断部506和经过后方向推断部507所提取的上述相应推定方向为θbf和θaf,该运动方向检测部508便获得θbf和θaf之间差值的符号,该符号表明声源的运动方向。例如,在图11情形下,若(θaf-θbf)为正值,便表明该声源运动方向是沿着箭头方向的。

图12是表示按照本实施例运作方式执行处理的流程图。

上面对第五实施例的说明当中,采用诸如FIFO(先进先出)缓存器这种数据缓存器505,来获得在生成一经过检测结果之前的时刻所生成的推定方向。但应理解,作为实施本实施例的一替代方式,可等效地将生成经过检测结果时刻所获得的推定方向进行寄存,以等待预定个数的时间窗周期,并从经过检测部216当中获得该时刻生成的推定方向,将这样获得的两个推定方向相减,便得到如减法结果正负号所示的声源运动方向。

作为实施本实施例的另一替代方式,可利用就推定方向缓存器505所述的缓存器,来获得在生成一经过检测结果之前的时刻经过检测装置216所生成的推定方向,以便生成一经过检测结果之后等待规定个数的时间窗周期,再获得该经过检测部216那一时刻所生成的推定方向,将这样获得的最早和最近一次的推定方向相减,便得到如减法结果正负号所示的声源运动方向。

可这样理解,不论采用上述替代方案中哪一个,每一个方案均基于利用一经过检测结果,作为声源跨过一特定方向范围、当前正移动通过麦克风阵列102的标志。

(第六实施例)

下面参照图13中总体系统框图和图14中流程图说明第六实施例。该实施例由每一个都如上面对先前实施例中相应标号的部分所作的说明那样运作的麦克风阵列102、声源方向推断部116和经过检测部216,以及速度求出部609所组成。该速度求出部609由数据缓存器605、运动间隙运算部606、角度量确定部607以及速度求出部609所组成。该速度求出部609对声源方向推断部116和经过检测部216提供的数据进行运作来确定移动通过麦克风阵列102的声源的速度。

其运作如下。声源方向推断部116所生成的声源连续推定方向送至经过检测部216和速度求出部609中的数据缓存器605。数据缓存器605能够存储表示声源固定的多个连续获得的推定方向的数据,推定方向的个数按照所预见的声源典型或最大速度并按照固定方式预定的角度量Ω(下面说明)来预先确定。与相应的时间窗相对应的连续获得的声源推定方向依次写入缓存器605。当经过检测部216检测出声源移动通过麦克风阵列102(如生成一经过检测结果所示)时,便由运动间隙运算部606读出这时数据缓存器605的内容。

运动间隙运算部606接着根据由此得到的与连续的时刻分别对应的所经历的推定方向集合,确定声源移动通过一由角度量确定部607规定、令为Ω的预置角度量(即相对于麦克风阵列102的连续方向范围)所需的时间T长度(即表示为若干个时间窗周期)。

速度检测部608接着用下面式(8),根据角度量Ω和所得到的数值T运算声源移动的角速度。

ω=Ω/T        式(8)

已知麦克风阵列602和声源601之间的长度L。速度检测部608用下面式(9)运算声源的线速度V。

V=Ltan(ω)     式(9)

从速度检测部608输出表示所运算出的速度值的数据。

图14示出在上面所述运作方式下按照本实施例执行的处理步骤。

虽然就上面第六实施例说明的例子是通过测定声源方向移动通过一预定角度量所需的时间量来运算声源角速度的,但可等效为预先规定一固定的时间间隙,利用缓存器605中的内容来获得声源方向在该预先规定的时间间隙内所改变的角度量。

此外,虽然就上面第六实施例说明的例子是依据生成一经过检测结果时刻之前所发生的声源方向改变量来运算声源角速度的,但可等效为依据生成一经过检测结果时刻之后所发生的声源方向改变量来运算声源角速度。也就是说,可测定例如生成一经过检测结果时刻之后固定时间间隙内所发生的连续获得的推定方向的角度改变量。

象这样按照本实施例,不仅可检测经过的声源,而且还可通过将经过检测结果用作启动速度求出处理的触发器,得出声源通过的速度。

(第七实施例)

下面参照图15中总体系统框图和图16中流程图来说明第七实施例。该实施例由每一个都如上面对先前实施例中相应标号的部分所作的说明那样运作的麦克风阵列102、声源方向推断部116和经过检测部216,以及方位控制部706所组成。方位控制部706由方位控制器704、加法器705以及延迟元件阵列703所组成。该延迟元件阵列703分别与麦克风阵列102中的麦克风对应,并接收其相应的音频信号。

方位控制部706对麦克风阵列102所生成的输出信号和声源方向推断部116以及经过检测部216所提供的数据进行运作,以便随声源移动通过该麦克风阵列102获得一表示声源所发出声音的监测信号。由于当声源基本上距麦克风阵列为相同距离时将会监测到各个声源所发出的声音,因而这样一种监测信号可用来推断例如连续声源所生成声功率的相应水平。

方位控制部706中,方向控制器704按下列方式设定延迟元件703的相应延迟来响应经过检测部216所生成的经过检测结果。当声源检测为正通过麦克风阵列102(如经过检测部216生成一经过检测结果所示),便令生成一经过检测结果时刻所获得的声源推定方向为θs,方向控制器704用下面式(10)运算向量d[m](m=1,2,……,M)。 >>d>[>m>]>=>>>[>1>,>>e>>->jωτ>>>,>>e>>->j>>ω>2>>τ>>>,>.>.>.>.>.>.>,>>e>>->j>>ω>>(>M>->1>)>>>τ>>>]>>&Tgr;>>>s>  式(10)

这里,τ由下面式(11)定义,其中c表示声音速度。

τ=(dsinθs)/c    式(11)

向量d[m]的元素设定为M个延迟元件703的相应延迟值。通过如此设定延迟值,延迟元件所生成的相应延迟的音频信号便在相位上与沿方向θs到达的声源信号保持同步,即,通过累加加法器705中各延迟元件的输出,利用沿θs方向所加上的方位获得一监测信号。这样,可有选择地获得当前处于方向θs上的声源所发出声音的声级,即可监测一特定移动声源所生成的声音。

因此,方位控制部706所生成的监测信号,是作为麦克风阵列102各输出信号加上一适当方位这样一种组合获得的。

象这样按照第七实施例,除了获得声源相对于麦克风阵列102的连续推定方向,判别声源何时正通过麦克风阵列102以外,还可通过使麦克风阵列102的有效方位在该声源方向上适当取向,并将对声源经过的检测用作启动该方位取向的触发器,来监测该声源所发出声音的声级。因而,按照本实施例,仅用单个麦克风阵列,便可有选择地监测处于麦克风阵列的任一方向上的特定声源所发出的声音。

可设想利用本实施例所生成的监测信号的种种方法,例如在数据缓存器(图中未图示)中设定连续的多个监测信号取样,并在生成一经过检测结果时刻之后经历了一固定时间间隙之后读出当前缓存器内容。这样,各个特定声源通过麦克风阵列102寸可获得监测信号的条件。

假定采用这样一种输出缓冲器的情况下,在图16流程图中说明本实施例的处理步骤。

(第八实施例)

按照先前的实施例,方位控制器704需要每当从经过检测部216得到声源的经过检测结果以及声源方向推断部116所生成的推定方向,便对延迟元件703集合建立一延迟值的新集合,以使麦克风阵列102的有效方位与声源当前的推定方向一致。这些推定方向实际上会随声源的相应速度等而有所改变,例如,声源移动较慢的话,在声源仅移动通过经过检测范围Pn中最初一小部分的时刻便会达到上面提及的范围内推定方向的阈值个数nt。相反,声源移动较迅速,因而其相对于麦克风阵列的方向每一时间窗均改变一大角度量的话,声源便会在对该声源来说达到范围内推定方向阈值个数nt的时刻,几乎到达该经过检测范围Pn中的最末方向θf。

在声源高速移动且相互间间隔距离相对较小,例如高速公路上行驶的汽车这种情况下,(由于系统性能的制约)会无法使对延迟元件703建立一延迟时间的更新集合这种运作与生成一新的经过检测结果的时刻保持同步。下面将要说明的第八实施例专门用于克服这种问题。图17示出该实施例的总体组成。与先前实施例具有基本的相似之处,由声源方向推断部116、经过检测部216、2个数据提取部814、817以及分别接收方位控制部706A和方位控制部706B所生成数据值的2个相对应数据缓冲器813、816所组成。按照本实施例,麦克风阵列102的输出信号不仅送至声源方向推断部116和方位控制部706A,还送至方位控制部706B。

每一方位控制部706A、706B执行与图15所示先前实施例中方位控制部706相似的功能。但每一方位控制部706A、706B中赋予延迟元件集合的相应延迟值是按固定方式预先规定的,以便在方位控制部706A情况下提供沿方向θ1的方位,而在方位控制部706B情况下提供沿方向θ2的方位。以方位控制部706A为例,每当方位控制部706A生成一表示沿方向θ1接收的声级的新数字数据取样(即,作为方位控制部706A按延迟元件703的输出信号加上一特定方位的组合所生成的监测信号其中一部分),便在数据提取部814的控制下将它写入缓存器813中。

方位控制部706B、缓存器816和数据提取部817,就方向θ2而言,按相同方式运作。

本实施例的基本原理可通过参照图19中的概念图加以理解。如图所示,所定义的相对于麦克风阵列102的第一预定方向范围R1以方向θ1为中心,而第二方向范围R2以方向θ2为中心。上面提及的由经过检测部216用来判别是否发生过经过检测的预定方向范围(即,如上文所示,由此对所获得的一声源的推定方向处于该范围的次数进行计数,若N个连续时间窗周期内的计数超过阈值个数nt的话,便判别有经过检测发生)从一初始方向θr延续至结束方向θf。图19中,对该声源100来说,当它到达范围R1内所示位置时,便会达到范围内推定方向的阈值个数nt。数据提取部814因而从数据缓存器813当中读出当前保持在该缓存器中的声级数据,即表示如同沿方向θ1方位获得的那样接收到的声级变化的数据。同样,对该声源101来说,当它到达范围R2内所示位置时,便会达到阈值个数nt。数据提取部817因而从数据缓存器816当中读出当前保持在该缓存器中的数据,即表示如同沿方向θ2方位获得的那样接收到的声级变化的数据。

在相应的定时,例如按照接收声级数据的外部装置的请求,在数据提取部814、817的控制下,执行从缓存器814、817当中的读出。

因而,可以理解,按照本实施例,由于按固定方式预先规定方位控制部中延迟元件集合的延迟值,从而不对延迟元件703的延迟值进行更新,因而克服了先前实施例的不足。但对于每一声源来说,将会根据至少在监测所接收到的声级时刻接近声源方向的麦克风阵列方位,来获得与该声源相对应、表示所接收到声级变化的监测数据。因此,即便在某些声源可以高速移动的情况下,也可获得接近于正确的监测声级值。

会进一步理解,虽然按照本实施例,仅利用2个方位控制部,但可通过增加方位控制部个数来实现声级测定的更高准确性,或增大可进行测定的声源速度范围,由此增加诸如图19中R1和R2这种角方向范围的个数。

图18是示出本实施例基本工作原理的流程图。

按照本实施例,例如2个声源按基本相同的较高速度行进,并且仅分开较短距离的话,这些声源中每一个声源相应的经过检测结果便会由经过检测部216在一较短时间间隙内连续生成。这样,(响应经过检测结果)数据在写入后再从缓存器813或816中读出所必须经历的最小时间量,由声源会达到的最大速度和连续声源间的最小距离确定。令2个声源间的间隔(表示为沿行进线的距离)为S,两者的共同速度为V,则需要在(作为上述2个声源中第一个的经过检测结果而写入数据起)小于大约S/V的时间间隙内从这样一种缓存器当中进行数据读出,来确保第一声源的声级数据不会因第二声源的声级数据写入而丢失。

图20中的概念图示出分别按与经过检测部216相同方式配置的2个经过检测部216A、216B可如何用来获得相向行进的声源(例如双向街道上的汽车交通)的经过检测数据,并将相应的经过检测结果送至2个方位控制部集合807A、811A和807B、811B。图22中,邻近这样一种双向街道设置麦克风阵列102,其中存在交通流的第一路径805将称为上行路径,而第二路径804则称为下行路径。来自麦克风阵列102的麦克风输出信号送至声源方向推断部116,并如图17中实施例所示送至方位控制部807A、811A,还送至第二对方位控制部807B、811B。声源方向推断部116所获得的推定方向送至每一个经过检测部216A和216B。

经过检测部216A(仅检测通过上行路径805上经过检测范围的运动)输出的经过检测结果以及与这样一种经过检测结果相对应的每一推定方向,送至与图17中方位控制部807、811起同样作用的方位控制部807A、811A。经过检测部216B(仅检测通过下行路径804上图20中所示θr至θf这一经过检测范围的运动)输出的经过检测结果以及与这样一种经过检测结果相对应的每一推定方向,送至方位控制部807B、811B。对于上行路径805(图22当中省略)上的经过检测来说,方位控制部807A、811A所用的方向范围可如图19所示,即从该图中θr延续至θf。

这样,单个麦克风阵列102和单个声源方向推断部116便可用来对这两种运动路径804、805均实施声源经过检测和麦克风阵列方位控制。

图21是用以示出各个经过检测部216A、216B所执行的处理步骤的局部流程图(其中所省略的步骤S2、S3与图7流程图中那些步骤相同)。会理解,本例子中的条件步骤S8,必须实际判断当前推定方向(或者,若经过检测部216在一个时间窗期间生成多个的话,则判断这些方向其中之一):

(a)是否大于(即比结束方向θf还超前)或等于该先前时间窗所获得的推定方向,以及

(b)是否在经过检测范围Pn以内,以及

(c)与该先前时间窗所获得的推定方向相差仅仅一预先规定的最大量。

上面的条件(a)和(c)所起到的作用在于,确保与所需声源在相反方向上行进的任何声源所得到的推定方向会被忽略。该条件(c)中规定的最大量将取决于连续声源间所预见的最小距离量以及就声源而言所预见的速度范围。

虽然上面是参照具体实施例说明本发明的,但应理解,可设想实施上述实施例,落在所附权利要求书中保护范围内的这些实施例的种种修改方案或替代方式。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号