首页> 中国专利> 噪声环境下的语音可懂度测量方法及装置

噪声环境下的语音可懂度测量方法及装置

摘要

本发明涉及涉及噪声环境下的语音可懂度测量方法及装置。本发明前端分别连接计算机、喇叭、人工耳、待测通信终端;所述前端有多通道声卡、信号采集部件、控制部件,多通道声卡连接喇叭,待测通信终端通过电缆或无线电与前端的信号采集部件连接,控制部件分别连接多通道卡和信号采集部件;所述计算机内存储有特殊噪声测试用例和测试计算程序,计算机连接前端中的控制部件。本发明解决了过去人为主观评估所带来的费时费力,且不同的人会得出不同的结果以及无法准确和客观的缺陷。本发明有效地将噪声和想要的语音信号分开,从而提供一个有效、客观、准确地通信终端的语音可懂度的测量装置和方法,保证了准确和客观。

著录项

  • 公开/公告号CN102510418A

    专利类型发明专利

  • 公开/公告日2012-06-20

    原文格式PDF

  • 申请/专利权人 声科科技(南京)有限公司;

    申请/专利号CN201110336392.5

  • 发明设计人 张铭;

    申请日2011-10-28

  • 分类号H04M1/24(20060101);G10L11/00(20060101);

  • 代理机构32226 南京中新达专利代理有限公司;

  • 代理人孙鸥;朱杰

  • 地址 210008 江苏省南京市中山路348号中信大厦11楼

  • 入库时间 2023-12-18 05:38:43

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-12

    专利权的转移 IPC(主分类):H04M 1/24 专利号:ZL2011103363925 登记生效日:20220630 变更事项:专利权人 变更前权利人:南京声科科技有限公司 变更后权利人:深圳市爱普泰科电子有限公司 变更事项:地址 变更前权利人:210009 江苏省南京市鼓楼区山西路8号金山大厦B楼16F 变更后权利人:518000 广东省深圳市龙华区观澜街道大富社区大富工业区20号硅谷动力智能终端产业园A4栋501

    专利申请权、专利权的转移

  • 2015-11-25

    授权

    授权

  • 2013-03-13

    专利实施许可合同备案的注销 IPC(主分类):H04M1/24 合同备案号:2012320001029 让与人:声科科技(南京)有限公司 受让人:江苏摩尔信息技术有限公司 解除日:20130115 申请日:20111028

    专利实施许可合同备案的生效、变更及注销

  • 2013-02-13

    专利实施许可合同备案的生效 IPC(主分类):H04M1/24 合同备案号:2012320001029 让与人:声科科技(南京)有限公司 受让人:江苏摩尔信息技术有限公司 发明名称:噪声环境下的语音可懂度测量方法及装置 申请公布日:20120620 许可种类:独占许可 备案日期:20121219 申请日:20111028

    专利实施许可合同备案的生效、变更及注销

  • 2012-07-18

    实质审查的生效 IPC(主分类):H04M1/24 申请日:20111028

    实质审查的生效

  • 2012-06-20

    公开

    公开

查看全部

说明书

技术领域

本发明涉及语音可懂度、清晰度、噪声、消除、噪声下通信技术,特别涉及 噪声环境下的语音可懂度测量方法及装置。

技术背景

在噪声环境下的语音主要是集中于如何提高可懂度,此对于通信终端音频性 能的一个重要指标。

在本发明之前,在噪声环境下的语音可懂度的客观测量,想要听到的语音是 和噪声混叠在一起,因此,首先必须将噪声和想要听到的语音分开。现有的处理 方法没法将噪声和想要的语音分开,存在估计误差大的缺陷。

而且有些语音处理会在噪声环境下,自动提高接收端的音量和调节接收端语 音的频谱。可懂度直接影响到通信终端的应用效果,是噪声通信和录音中质量标 准的重要指标。如果无法进行自动测量,则只能做人为的主观评估,这样不仅费 时费力,而且不同的人会得出不同的结果,无法准确和客观。

发明内容

本发明的目的在于克服上述缺陷,研制一种噪声环境下可懂度的测量方法及 装置。

本发明的技术方案是:

噪声环境下的语音可懂度测量装置,其主要技术特征在于前端分别连接计算 机、喇叭、人工耳、待测通信终端;所述前端有多通道声卡、信号采集部件、控 制部件,多通道声卡连接喇叭,待测通信终端通过电缆或无线电与前端的信号采 集部件连接,控制部件分别连接多通道卡和信号采集部件;所述计算机内存储有 特殊噪声测试用例和测试计算程序,计算机连接前端中的控制部件。

本发明的另一技术方案是:

噪声环境下的语音可懂度测量方法,其主要技术步骤在于:

(1)将计算机里储存的特殊噪声测试用例通过前端的控制部件发送到前 端的多通道声卡;

(2)特殊噪声测试用例经多通道声卡发送到喇叭中;

(3)前端中的控制部件控制特殊噪声测试用例在喇叭上的播放时序和音 量;

(4)前端中信号采集部件测得人工耳中的标准麦克风的接收信号;

(5)前端的控制部件将该信号送到计算机;

(6)计算机对该信号进行分析计算、处理,从而测量想要语音的在环境噪 声下可懂度。

本发明的优点和效果在于有效地将噪声和想要的语音信号分开,从而提供一 个有效、客观、准确地通信终端的语音可懂度的测量装置和方法,这样解决了之 前人为的主观评估通信终端的语音可懂度的方法,保证了准确和客观。

本发明的其他具体优点和效果将在下面继续说明。

附图说明

图1——本发明总体结构方框示意图。

图2——本发明中测试用例播放和可懂度计算流程示意图。

图3——本发明环境噪声测试用例以及远端信号的播放和人工耳接收信号 的录音次序示意图。

图4——本发明环境噪声测试用例以及远端信号的播放和人工耳接收信号 的录音的另一种实现方法示意图。

图5——本发明的语音可懂度的计算示意图。

具体实施方式

本发明的技术思路是:

环境噪声的测试用例包含不同的噪声信号,如餐馆、地铁、火车站、汽车、 马路的噪声等等。远端信号的测试用例包含通信的另一端用户的讲话声,有男生、 女生及不同语种等。环境噪声的测试用例在计算机控制下通过播放器和喇叭功率 放大器从喇叭在声学实验室里播放出来作为待测通信终端的环境噪声。远端信号 的测试用例也是在计算机统一控制下通过传输和发射设备发送给待测通信终端。 声学人工耳接收到的信号送入计算机进行信号时间对齐,然后计算语音的可懂 度。

下面是具体说明。

如图1所示:

语音可懂度的测量装置主要有播放噪音的喇叭、前端硬件、(声学)人工耳 和(后端的软件)计算机组成。

喇叭是用来播放噪音的,用以模拟环境中的各种噪声,前端的硬件主要是用 于系统的播放音和录音及其控制以及信号的采集;具体说,前端包括多通道声卡、 信号采集、控制部件,人工耳用于模拟用户听待测通信终端听筒的语音。后端的 软件运行在计算机中,用于产生、存储测试用例,并分析计算语音在环境噪声下 的可懂度。

具体的一个例子是:

8个喇叭按照相差45度沿圆周排列,每个喇叭有一个引线,分别连接到装 置的前端的多通道声卡和控制部件。计算机中的各种噪声测试用例,通过前端的 多通道声卡、控制部件,在喇叭上播放对应的噪声来模拟各种环境噪声。这里的 喇叭根据需要,可以逐一播放噪声,也可以同时播放噪声或各种数量的喇叭组合 起来播放噪声。

喇叭的数量和摆放排列方式不限于以上的例子,可以有其它的形式。

如图2所示:

测试用例的具体播放和可懂度计算的流程。

1),前端中的控制部件发出控制信号来控制所设计的特殊噪声测试用例的播 放时序、播放通道和播放音量。

2),所设计的噪声和远端语音的测试用例经过前端中的多通道声卡和喇叭内 置或外接的功率放大器,在喇叭中播放出,作为环境噪声;环境噪声的测试用例 包含不同的噪声信号,如餐馆、地铁、火车站、汽车、马路的噪声等等;远端信 号的测试用例包含通信的另一端用户的讲话声,有男生、女生及不同语种等。

3),待测通信终端通过其喇叭或受话器发出远端的语音。

4),人工耳中的标准麦克风接收到远端的语音和环境噪声,通过前端的控制 部件发送回计算机中。

5),计算机进行时间对齐、分析计算,从而得出测试语音可懂度。

如图3所示:

本发明中的环境噪声测试用例以及远端信号的播放和人工耳接收信号的录 音次序。

1),计算机先通过放噪音的喇叭播放一段环境噪声,此时不播放任何其他声 音;

2),人工耳中的标准麦克风接收到声音通过前端发送到计算机中;

3),接着再通过噪音喇叭播放完全一样的环境噪声,同时还通过待测物的喇 叭或受话器播放待测通信终端的远端声音;

4),人工耳中的标准麦克风接收到声音再通过前端发送到计算机中

如图4所示:

本发明中环境噪声测试用例以及远端信号的播放和人工耳接收信号的录音 的另一种实现方法:

1),将所有的播放的次序排列好,即:噪声测试矢量中安排一段环境噪声, 接着一段0值,再接着另一段同样的噪声;

2),远端信号的测试矢量先放一段0值,然后再与第二段环境噪声的时间上 配合放置一段远端讲话;

3),接着再通过噪音喇叭播放环境噪声,通过待测物的喇叭或受话器播放待 测通信终端的远端声音;

4),人工耳中的标准麦克风接收到声音通过前端发送到计算机中。

图5所示:

本发明中语音可懂度的计算。

1),得到的从人工耳中的标准麦克风传来的信号,进行划分、切割,主要的 目的是将纯噪声和噪声与语音混叠的信号分开;

2),进行第一次时间对齐,以消除播放、传输及录音等带来的延时;

3),将纯噪声的信号作为参考信号,通过自适应滤波将混叠信号中的噪声消 除掉,只保留远端的语音信号,即从待测通信终端的听筒得到的语音信号;

4),用纯噪声来建立心理声学模型和掩蔽曲线;

5),用前面求出的远端语音信号计算各频段功率,并与掩蔽曲线进行比较, 计算出各个频段的信噪比值;

6),再根据各个频段的信噪比,计算可懂度。

本发明的处理方法,如图2、图3、图4、图5所示:

1.计算机里储存各种噪声信号和远端讲话声等测试用例;

2.将计算机里储存的测试用例发送到前端的多通道声卡;

3.前端中的控制部件控制噪声测试用例在喇叭上的播放时序和音量;

4.前端的多通道声卡将测试用例分别发送到多个喇叭中,一个例子是采用8个 喇叭,沿圆周等角度排列;

5.待测物设置在8个喇叭中间,并在人工耳上或前面,通过电缆或无线电与前 端连接;

6.计算机先通过8个喇叭播放一段环境噪声,此时不播放任何其他声音;

7.人工耳中的标准麦克风接收到声音通过前端发送到计算机中;

8.接着还是通过8个喇叭播放完全一样的环境噪声,同时也通过待测物的喇叭 或受话器播放待测通信终端的远端声音;

9.人工耳中的标准麦克风接收到声音再通过前端发送到计算机中;

以上步骤6)到9)也可以用10)到12)来实现

10.将所有的播放的次序排列好,即:噪声测试矢量中安排一段环境噪声,接 着一段0值,再接着另一段同样的噪声;

11.远端信号的测试矢量先放一段0值,然后再与第二段环境噪声的时间上配合 放置一段远端讲话;

12.接着再通过8个噪音喇叭播放环境噪声,通过待测物的喇叭或受话器播放 待测通信终端的远端声音;

13.人工耳中的标准麦克风接收到声音通过前端发送到计算机中;

14.将该信号在计算机中进行时间对齐、分析计算,从而得出语音可懂度。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号