首页> 中国专利> 用于语音拾取的质点振速传感器微阵列及语音拾取方法

用于语音拾取的质点振速传感器微阵列及语音拾取方法

摘要

本发明涉及一种用于语音拾取的质点振速传感器微阵列,包括质点振速敏感元件、声压敏感元件(2),包括2组质点振速敏感元件(11,12),每组质点振速敏感元件对称分布,2组质点振速敏感元件的对称中心相同,2组所述质点振速敏感元件相互垂直分布,所述声压敏感元件(2)位于所述对称中心位置。本发明还提供了一种语音拾取方法。本发明通道数少、信噪比高、尺寸小,有效实现360度全方位语音拾取。

著录项

  • 公开/公告号CN112543397A

    专利类型发明专利

  • 公开/公告日2021-03-23

    原文格式PDF

  • 申请/专利权人 中国电子科技集团公司第三研究所;

    申请/专利号CN202011429411.4

  • 发明设计人 李光;刘迪;周瑜;刘云飞;

    申请日2020-12-07

  • 分类号H04R3/04(20060101);

  • 代理机构11421 北京天盾知识产权代理有限公司;

  • 代理人张彩珍

  • 地址 100015 北京市朝阳区酒仙桥北路乙7号

  • 入库时间 2023-06-19 10:21:15

说明书

技术领域

本发明涉及一种用于语音拾取的质点振速传感器微阵列及语音拾取方法。

背景技术

在实际复杂环境中,单个麦克风在拾取语音信号时,会不可避免地受到来自周围环境噪声、传输媒介噪声、房间混响以及其它说话人的话音干扰,在进行远场拾音时会严重影响到语音拾取质量与语音识别率。为解决单麦克风的不足,通常会采用麦克风阵列进行远场的语音拾取。麦克风阵列可以对不同空间方向的声压信号进行空、时谱处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,在语音交互前端完成高质量的远场拾音,以提高真实环境下的语音识别率。传统麦克风阵列受制于半波长理论限制,麦克风数量越多其孔径就越大,且存在空域混叠以及运算复杂度高等不足,极大限制了麦克风阵列的设计自由性与应用场景。

语音声场兼有标量场(声压)和矢量场(质点振速)特性,声压和质点振速都携带有丰富的语音信息。现有麦克风阵列均是基于声压麦克风,如市场上常见的MEMS麦克风、咪头等;目前,语音质点振速测量主要有两种测量手段,一种是间接测量手段,通过两个具有一定间距的声压传感器构成声压梯度计算质点振速(专利号:201310726022),但受限于声压传声器之间的幅、相频一致性和物理间距等条件,具有灵敏度低,响应频带窄、测量误差大等不足;另外一种则是直接测量手段,基于MEMS热式流量测量机理(专利号:201310752209)制作而成的空气声质点振速敏感元件,具有方向性、不随频率变化的“8”字型指向特性以及指向性增益,在先进单兵装备、狙击手定位、噪声源识别和被动声雷达等方面有着广泛应用,但尚未应用于语音交互技术领域。

发明内容

本发明的发明目的在于提供一种用于语音拾取的质点振速传感器微阵列及语音拾取方法,通道数少、信噪比高、尺寸小,有效实现360度全方位语音拾取。

基于同一发明构思,本发明具有两个独立的技术方案:

1、一种用于语音拾取的质点振速传感器微阵列,包括质点振速敏感元件、声压敏感元件,包括2组质点振速敏感元件,每组质点振速敏感元件对称分布,2组质点振速敏感元件的对称中心相同,2组所述质点振速敏感元件相互垂直分布,所述声压敏感元件位于所述对称中心位置;所述2组质点振速敏感元件的信号输出端、所述声压敏感元件的信号输出端接后端采集处理电路的信号输入端。

进一步地,所述2组质点振速敏感元件声压敏感元件设置于微阵列骨架上,所述微阵列骨架为正四面棱柱体,所述2组质点振速敏感元件对称分布于所述正四面棱柱体的侧面;所述声压敏感元件分布于所述正四面棱柱体的上端面,所述声压敏感元件的中心与所述正四面棱柱体的对称中心相同。

进一步地,所述2组质点振速敏感元件、声压敏感元件设置于微阵列骨架上,所述微阵列骨架为平面骨架,2组质点振速敏感元件呈十字形分布,所述声压敏感元件位于所述十字形的中心位置。

进一步地,所述微阵列骨架外侧设置有防护罩。

进一步地,设有1个声压敏感元件;每组质点振速敏感元件设有2n个质点振速敏感元件,n≥1,n的大小根据质点振速传感器微阵列的信噪比与尺寸确定。

进一步地,每组质点振速敏感元件相同侧面的各质点振速敏感元件之间等间距平行分布。

进一步地,所述质点振速敏感元件为基于MEMS热式流量测量机理的质点振速敏感元件。

进一步地,所述声压敏感元件为驻极体或硅麦声压敏感元件。

2、一种利用上述的用于语音拾取的质点振速传感器微阵列的语音拾取方法,所述2组质点振速敏感元件的信号输出端、所述声压敏感元件的信号分别输出2通道质点振速信号和1通道声压信号,后端采集处理电路根据输入的2通道质点振速信号和1通道声压信号,进行声源定向。

进一步地,后端采集处理电路先对2组质点振速敏感元件输出的质点振速模拟信号分别进行对称模拟求和后,再基于2通道质点振速信号和1通道声压信号三角函数关系,进行声源定向。

本发明具有的有益效果:

本发明包括质点振速敏感元件、声压敏感元件,包括2组质点振速敏感元件,每组质点振速敏感元件对称分布,2组质点振速敏感元件的对称中心相同,2组所述质点振速敏感元件相互垂直分布,所述声压敏感元件位于所述对称中心位置。本发明通道数少,具有1个声压通道和2个质点振速通道;尺寸小,微阵列结构紧凑并采用质点振速敏感元件、声压敏感元件密集排布;通过增加质点振速敏感元件可有效提高信噪比。本发明通道数少、信噪比高、尺寸小,有效实现360度全方位语音拾取。

本发明2组质点振速敏感元件、声压敏感元件设置于微阵列骨架上,所述微阵列骨架为正四面棱柱体,所述2组质点振速敏感元件对称分布于所述正四面棱柱体的侧面;所述声压敏感元件分布于所述正四面棱柱体的上端面,所述声压敏感元件的中心与所述正四面棱柱体的对称中心相同;2组质点振速敏感元件、声压敏感元件设置于微阵列骨架上,所述微阵列骨架为平面骨架,2组质点振速敏感元件呈十字形分布,所述声压敏感元件位于所述十字形的中心位置。本发明采用上述微阵列布置方式,结构紧凑,尺寸小,并同时保证360度全方位语音拾取效果。

本发明设有1个声压敏感元件;每组质点振速敏感元件设有2n个质点振速敏感元件,n的大小根据质点振速传感器微阵列的信噪比与尺寸确定。每增加一倍质点振速敏感元件,针对空间不相关高斯白噪声,微阵列信噪比提高3dB,在尺寸允许范围内,增加质点振速敏感元件可有效提高本发明微阵列的信噪比。

本发明质点振速敏感元件为基于MEMS热式流量测量机理的质点振速敏感元件;所述声压敏感元件为驻极体或硅麦声压敏感元件;所述2组质点振速敏感元件的信号输出端、所述声压敏感元件的信号输出端接后端采集处理电路的信号输入端,所述后端采集处理电路先对2组质点振速敏感元件输出的质点振速模拟信号进行对称模拟求和后,再基于2通道质点振速信号和1通道声压信号三角函数关系,进行声源定向。本发明通过质点振速敏感元件和声压敏感元件采集语音信号,再通过后端采集处理电路根据声压信号和质点振速信号进行声源定向,由于声源定向算法、波束形成算法与阵列接收频率、孔径无关,这与传统声压麦克风阵列有着本质不同,质点振速传感器微阵列尺寸可以做到毫米级(体积小于1cm

附图说明

图1是本发明实施例一的立体结构示意图;

图2是本发明实施例一的电路连接图;

图3是本发明实施例二的电路连接图。

具体实施方式

下面结合附图所示的实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。

实施例一:

质点振速传感器微阵列

如图1、图2所示,质点振速传感器微阵列包括质点振速敏感元件、声压敏感元件2,包括2组质点振速敏感元件,即第一组质点振速敏感元件11和第二组质点振速敏感元件12,每组质点振速敏感元件对称分布,2组质点振速敏感元件的对称中心相同,2组所述质点振速敏感元件11、12相互垂直分布,所述声压敏感元件2位于所述对称中心位置。本实施例中,所述2组质点振速敏感元件11、12、声压敏感元件2设置于微阵列骨架31上,所述微阵列骨架31为正四面棱柱体,所述2组质点振速敏感元件11、12对称分布于所述正四面棱柱体的侧面;所述声压敏感元件2分布于所述正四面棱柱体的上端面,所述声压敏感元件2的中心与所述正四面棱柱体的对称中心相同。设有1个声压敏感元件2;每组质点振速敏感元件设有2n个质点振速敏感元件,n≥1,n的大小根据质点振速传感器微阵列的信噪比与尺寸确定。每组质点振速敏感元件相同侧面的各质点振速敏感元件之间等间距平行分布,间距为d。质点振速敏感元件11、12采用基于MEMS热式流量测量机理的质点振速敏感元件。声压敏感元件2采用驻极体、硅麦声压敏感元件或其他类型的声压敏感元件。所述微阵列骨架外侧设置有防护罩4。

如图2所示,2组质点振速敏感元件的信号输出端Sig1、Sig2,声压敏感元件的信号输出端Sig3接后端采集处理电路的信号输入端。

实施例二:

质点振速传感器微阵列

如图3所示,实施例二中,2组质点振速敏感元件11、12、声压敏感元件2设置于微阵列骨架32上,所述微阵列骨架32为平面骨架,2组质点振速敏感元件11、12呈十字形分布,声压敏感元件2位于所述十字形的中心位置。实施例二的其余结构及工作原理同实施例一。

实施例三:

一种利用上述质点振速传感器微阵列的语音拾取方法

后端采集处理电路先对2组质点振速敏感元件11、12输出的质点振速模拟信号分别进行对称模拟求和后,再基于2通道质点振速信号和1通道声压信号三角函数关系,进行声源定向。

工作时,微阵列共输出三通道信号,即第一组质点振速敏感元件11由信号输出端Sig1输出的第一通道质点振速信号;第二组质点振速敏感元件12由信号输出端Sig2输出的第二通道质点振速信号;声压敏感元件2由信号输出端Sig3输出的声压信号。后端采集处理电路分别对第一通道质点振速信号和第二通道质点振速信号对称模拟求和,对称模拟求和后两通道质点振速信号水平共点正交,因此本发明有效减少了通道数量。后端采集处理电路基于2通道质点振速信号和1通道声压信号三角函数关系,进行声源定向时可以采用可利用复声强器法、直方图法等声源方位DOA(Direction of arrival)估计方法。

上述1通道声压信号与2通道质点振速信号间的三角函数关系由声压敏感元件的全指向性与质点振速敏感元件的”8”字型空间指向性决定,与所述声压敏感元件、质点振速敏感元件的接收频率f及阵列孔径d无关。所述1通道声压信号与水平共点正交的2通道质点振速信号可通过组合与电子旋转方式形成指向声源的“单边”指向性波束。因此,在所述微阵列尺寸允许范围内,所述阵列尺寸可做到毫米级。通过增加所述质点振速敏感元件1的数量可以提高整个微阵列的信噪比。具体的,当所述第一组质点振速敏感元件11与第二组质点振速敏感元件12数量每增加一倍,针对空间不相关高斯白噪声,所述微阵列信噪比可提高3dB。实施过程如下:

对于空间不相关高斯白噪声,所述微阵列的阵列增益为(参考文献黄庚,张蓓;基于Matlab的常见阵型阵增益性能仿真研究[J]):

G(dB)=10log(N)

其中,N为微阵列中质点振速敏感元件1数量的倍数。

当所述质点振速敏感元件1数量增加一倍时,微阵列的阵列增益提高量为:

△G(dB)=10log(2N)-10log(N)=10log(2)=3dB

虽然增加了所述质点振速敏感元件1的数量,但是所述微阵列的输出通道数并未变化,这是比传统麦克风阵列有优势的地方。由于微阵列声源定向与所述声压敏感元件2、质点振速敏感元件1的接收频率f及阵列孔径d无关,因此所述第一组质点振速敏感元件11与第二组质点振速敏感元件12可以布置的较为密集,当n=1时,微阵列的体积仅为0.5cm

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号