首页> 中国专利> 用于具有多个声学区域的车载通信系统的噪声相关的信号处理

用于具有多个声学区域的车载通信系统的噪声相关的信号处理

摘要

语音通信系统包括用于容纳一个或多个系统用户的语音服务室。语音服务室包括具有变化的声学环境的多个声学区域。至少一个输入话筒位于语音服务室内,用于产生来自所述一个或多个系统用户的话筒输入信号。至少一个扬声器位于服务室内。车载通信(ICC)系统接收并处理话筒输入信号,形成提供给至少一个输出扬声器中的一个或多个的扬声器输出信号。所述ICC系统包括ICC系统讲话者专用信号处理模块和听众特定信号处理模块中的至少一个,所述ICC系统至少部分地基于相关联的声学环境和导致的心理声学效应中的至少一个来控制话筒输入信号的处理和/或扬声器输出信号的形成。

著录项

  • 公开/公告号CN104508737A

    专利类型发明专利

  • 公开/公告日2015-04-08

    原文格式PDF

  • 申请/专利权人 纽昂斯通讯公司;

    申请/专利号CN201280074944.2

  • 申请日2012-12-26

  • 分类号G10K11/16(20060101);

  • 代理机构72002 永新专利商标代理有限公司;

  • 代理人张立达;王英

  • 地址 美国马萨诸塞州

  • 入库时间 2023-12-18 08:15:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-05

    授权

    授权

  • 2015-05-06

    实质审查的生效 IPC(主分类):G10K11/16 申请日:20121226

    实质审查的生效

  • 2015-04-08

    公开

    公开

说明书

对相关申请的交叉引用

本申请要求于2012年6月10日递交的、名称为“Noise Dependent SignalProcessing for In-Car Communication Systems with Multiple Acoustic Zones”的美国临时申请序列No.61/657,863的优先权,故通过引用的方式将其整体并入本文。

技术领域

本发明涉及语音信号处理,尤其是机动车中的语音信号处理。

背景技术

车载通信(ICC)系统通过补偿两个对话对端之间的声学损耗来在交通工具中的乘客之间提供增强的通信。存在针对这种声学损耗的若干原因。例如,典型地,司机无法转身对着坐在交通工具后排的听众,并且因此他对着风挡讲话。这可能导致他的语音信号的10dB-15dB的衰减。

为了提高从前排乘客到后排乘客的通信路径上的可识度和声音质量,语音信号由一个或若干话筒记录、由ICC系统处理并且在后排扬声器回放。通过使用两个单向ICC实例,可以实现还能增强后排乘客对前排乘客的语音信号的双向ICC系统。

图1示出了针对由驾驶员/前排乘客和后排乘客表示的两个声学区域的示例性系统。由针对这样的系统的两个声学区域中的每一个所使用的信号处理模块通常包括波束成形(BF)、降噪(NR)、信号混频(例如用于驾驶员和前排乘客)、自动增益控制(AGC)、反馈抑制(陷波(notch))、噪声相关的增益控制(NDGC)和均衡,如图2所示。波束成形将话筒阵列的波束导引到专用讲话者位置,例如驾驶员的座位或副驾驶员的座位。使用降噪来避免或至少缓和通过ICC系统传送的背景噪声。另外,通过所谓的齿音消除器(deesser)可以减少齿音(sibilant)。由于讲话者通常具有不同的讲话习惯,尤其是他们的语音音量,因此可以使用AGC来获得针对后排乘客的恒定的音频感受,而无论实际的讲话者是谁。通常需要反馈抑制来保证包括扬声器、交通工具内部和话筒的闭环的稳定性。使用NDGC来优化针对听众的声音质量,特别是回放信号的音量。另外,回放音量可以由限幅器来控制。需要均衡来使得该系统适应特定的交通工具,以及来优化针对后排乘客的语音质量。

对于单向系统和一些双向系统而言,这些标准方法通常是足够的。在最先进的系统中,典型地在每个ICC实例中仅使用一个噪声相关的模块(NDGC)以使得系统适应不同的声学场景。然而,当与ICC实例相关联的声学区域/场景的数量增加时,通常无法获得该系统的最佳性能。此外,具体的挑战是获得无关驾驶状态的、针对每个听众的一致的音频印象。取决于声学环境,可能发生若干心理声学效应。由于隆巴德效应(Lombardeffect),讲话者将改变他的声音特性以对听众保持清晰。在另一方面,从扬声器回放的语音信号将被听众位置处的背景噪声掩盖。当讲话者和听众位于两个不同的声学区域时,背景噪声可能显著不同,从而这两种效应可能发散。例如,驾驶员可能提高他前面的风扇的等级,而听众的风扇保持关闭。当驾驶员打开他的窗户时给出了类似的情况。在这两种情形下,驾驶员可能比所必须的更大声地讲话,因此,直接声音和扬声器的组合对听众来说是不方便的。

发明内容

在本发明的第一实施例中提供了语音通信系统,其包括用于容纳一个或多个系统用户的语音服务室。语音服务室还包括具有变化的声学环境的多个声学区域。至少一个输入话筒位于语音服务室内,用于产生来自所述一个或多个系统用户的话筒输入信号。至少一个扬声器位于服务室内。车载通信(ICC)系统接收和处理话筒输入信号,形成提供给至少一个输出扬声器中的一个或多个的扬声器输出信号。ICC系统包括讲话者专用信号处理模块和听众特定信号处理模块中的至少一个,所述ICC系统至少部分地基于相关联的声学环境和导致的心理声学效应中的至少一个,来控制对所述话筒输入信号的所述处理和/或所述扬声器输出信号的形成。

根据本发明的相关实施例,语音服务室可以是机动车、船舶或飞机的乘客室。讲话者专用信号处理模块可以例如通过至少部分地使用针对语音水平的目标峰值水平来对系统用户的隆巴德效应进行补偿,所述语音水平取决于系统用户的背景噪声。ICC系统可以包括至少部分地基于声学环境来处理话筒输入信号的齿音消除器。所述齿音消除器可以基于预期的噪声掩盖效应来缩放齿音消除(de-essing)的侵害性(aggressiveness)。ICC系统可以包括噪声相关增益控制(NDGC),所述NDGC具有基于背景噪声水平而变化的可调整增益特性。NDGC可以包括限幅器模块,所述限幅器模块使用在声学环境的噪声特定特性来单独地处理每个扬声器输出信号中的峰值。所述ICC系统可以至少部分地基于确定的声学环境中的背景噪声的掩盖效应来处理所述话筒输入信号和/或形成所述扬声器输出信号。语音服务室可能与交通工具相关联,其中,当交通工具以高速行进时,所述ICC系统执行与当所述交通工具以低速行进时相比增加的降噪。ICC系统在执行均衡时可以使用多个参数集,以便平衡语音质量和所述系统的稳定性。所述参数集中的一个或多个是依据驾驶情况经脱机训练的。所述ICC系统可以利用声学传感器驱动的传感器信息和非声学交通工具提供的信号中的至少一个来确定所述参数集。

根据本发明的另一个实施例,提供了一种计算机实施的方法,其使用用于语音通信的一个或多个计算机过程。所述方法包括产生由多个输入话筒从服务室内的多个系统用户接收到的多个话筒输入信号,所述语音服务室包括具有变化的声学环境的多个声学区域。话筒输入信号是使用讲话者专用信号处理模块和听众特定信号处理模块中的至少一个来处理的,形成提供给位于语音服务室内的一个或多个扬声器的扬声器输出信号。所述处理包括至少部分地基于相关联声学环境和导致的心理声学效应中的至少一个来控制对所述话筒输入信号的所述处理和/或所述扬声器输出信号的形成。

根据本发明的相关实施例,语音服务室可以是机动车、船舶或飞机的乘客室。该方法可以包括由讲话者专用信号处理模块来对系统用户的隆巴德效应进行补偿。对系统用户的隆巴德效应进行补偿可以包括至少部分地利用针对语音水平的目标峰值水平,所述语音水平取决于系统用户的背景噪声。该方法可以包括由讲话者专用信号处理模块至少部分地基于声学环境来对所述话筒输入信号进行齿音消除。齿音消除可以包括至少部分地基于预期的噪声掩盖效应来缩放齿音消除的侵害性。该方法可以包括提供噪声相关增益控制(NDGC),所述NDGC具有基于背景噪声水平而变化的可调节增益特性。所述NDGC可以包括限幅器模块,该方法还包括由限幅器模块使用相关联的声学环境中的噪声特定特性来单独地处理每个扬声器输出信号中的峰值。该方法可以包括至少部分地基于确定的声学环境中的背景噪声的掩盖效应来处理话筒输入信号和/或形成扬声器输出信号。语音服务室可能与交通工具相关联,所述方法还包括当交通工具以高速行进时,执行与当交通工具以低速行进时相比增加的降噪。在对话筒输入信号和/或扬声器输出信号中的至少一个执行均衡时,可以利用多个参数集。所述参数集中的一个或多个是依据驾驶情况经脱机训练的。在确定所述参数集时,利用声学传感器驱动的传感器信息和非声学交通工具提供的信号中的至少一个。

根据本发明的另一个实施例,提供了编码在非临时性计算机可读介质中用于语音通信的计算机程序产品。所述产品包括用于开发由多个输入话筒从服务室内的多个系统用户接收到的多个话筒输入信号的程序代码,所述语音服务室包括具有变化的声学环境的多个声学区域。所述产品还包括用于使用讲话者专用信号处理模块和听众特定信号处理模块中的至少一个来处理话筒输入信号,形成提供给位于所述服务室内的一个或多个扬声器的扬声器输出信号的程序代码。所述处理包括至少部分地基于相关联声学环境和导致的心理声学效应中的至少一个来控制话筒输入信号的处理和/或扬声器输出信号的形成。

根据本发明的相关实施例,语音服务室可能是机动车、船舶或飞机的乘客室。所述产品还可以包括用于由讲话者专用信号处理模块例如通过至少部分地利用针对语音水平的目标峰值水平来对系统用户的隆巴德效应进行补偿的程序代码,所述语音水平取决于系统用户的背景噪声。所述产品还可以包括用于由讲话者专用信号处理模块至少部分地基于声学环境来对所述话筒输入信号进行齿音消除的程序代码。用于齿音消除的程序代码可以包括至少部分地基于预期的噪声掩盖效应来缩放齿音消除的侵害性。所述产品还可以包括用于噪声相关的增益控制(NDGC)的程序代码,所述NDGC具有基于背景噪声水平而变化的可调节增益特性。用于NDGC的程序代码可以包括用于限幅器模块的程序代码,所述限幅器模块使用相关联声学环境中的噪声特定特性来单独地处理每个扬声器输出信号中的峰值。用于处理话筒输入信号、形成扬声器输出信号得程序代码,可以至少部分地基于确定的声学环境中的背景噪声的掩盖效应。语音服务室可能与交通工具相关联,所述产品还包括当交通工具以高速行进时,执行与当交通工具以低速行进时相比增加的降噪的程序代码。所述产品可以包括用于在对话筒输入信号和/或扬声器输出信号中的至少一个执行均衡时利用多个参数集的程序代码。

附图说明

通过参照接下来的详细描述(参照附图来理解),将更容易地理解实施例的前述特征,在附图中:

图1示出了针对由驾驶员/前排乘客和后排乘客表示的两个声学区域的示例性系统(现有技术);

图2示出了在图1的系统的两个区域中的每一个中所使用的示例性信号处理模块(现有技术);以及

图3根据本发明的实施例示出了包括车载通信(ICC)系统的示例性交通工具语音通信系统。

具体实施方式

在本发明的示例性实施例中,灵活的信号处理系统和方法考虑了多区域ICC的不同声学环境和所导致的心理声学效应。接下来对细节进行描述。

图3根据本发明的实施例示出了包括车载通信(ICC)系统的示例性语音通信系统300。语音通信系统300可以包括可以运行在一个或多个计算机处理器设备上的硬件和/或软件。语音服务室(compartment),例如机动车中的乘客室301,能够容纳一个或多个乘客(其为系统用户305)。乘客室301还可以包括多个输入话筒302,其从系统用户305向语音通信系统300产生(develop)话筒输入信号。多个输出扬声器303从语音通信系统300向系统用户305产生扬声器输出信号。虽然ICC系统明确地与汽车相关联,但是要理解的是,ICC系统可以与任意的语音服务室和/或例如但不限于船舶或飞机的交通工具相关联。

乘客室301可以包括多个声学区域。示例性地示出了4个声学区域A、B、C和D,但是要理解的是,可能存在任意数量的声学区域。每个声学区域可以表示相对于其它声学区域来说不同的或潜在地不同的声学环境。

通过对系统用户305之间的声学损失进行补偿,ICC系统309增强了系统用户305之间的通信。可以处理由ICC系统309接收的、来自系统用户305的话筒输入信号,以最大化来自系统用户305的语音以及最小化其它音频源,所述音频源包括例如噪声和来自其它系统用户305的语音。此外,基于所述增强的输入信号,ICC系统309可以向针对多个系统用户305的一个或多个输出扬声器303产生优化的扬声器输出信号。

如以上结合图2所描述的,ICC系统309可以包括多种信号处理模块。示例性的信号处理模块可以包括但不限于波束成形(BF)、降噪(NR)、信号混频(例如用于驾驶员和前排乘客)、自动增益控制(AGC)、反馈抑制(陷波)、与噪声相关的增益控制(NDGC)和均衡(EQ)。波束成形将话筒阵列的波束导引到诸如驾驶员的座位或副驾驶员的座位的专用讲话者位置。使用降噪来避免或至少来缓和通过ICC系统所传输的背景噪声。另外,通过所谓的齿音消除器,可以降低齿音。由于讲话者通常具有不同的讲话习惯,尤其是他们的语音音量,尤其是他们的语音音量,因此可以使用AGC来获得针对后排乘客的恒定的音频感受,而无论实际的讲话者是谁。通常需要反馈抑制来保证包括扬声器、交通工具内部和话筒的闭环的稳定性。使用NDGC来优化针对听众的声音质量,特别是回放信号的音量。另外,回放音量可以由限幅器来控制。需要均衡来使得该系统适应特定的交通工具,以及来优化针对后排乘客的语音质量。

可以使用硬件、软件或其组合来实现ICC系统309。ICC系统309可以包括处理器、微处理器和/或微控制器以及多种类型的数据存储存储器,例如只读存储器(ROM)、随机存取存储器(RAM)或任何其它类型的易失性和/或非易失性存储空间。

在本发明的示例性实施例中,多区域ICC系统309信号处理考虑了存在于多个声学区域中的不同声学环境和它们导致的心理声学效应。为了实现这一点,ICC系统309信号处理可以包括讲话者专用信号处理模块311和/或听众特定信号处理模块313,二者都可以通过它们各自的噪声估计来考虑或触发。

经常发生在汽车交通工具内的一个心理声学效应是隆巴德效应。隆巴德效应或隆巴德反射是讲话者在强噪声中讲话时倾向于提高他们的发音努力以增强他们声音的可听度。这种变化不仅包括响度还包括其它声学特性,例如音高(pitch)和速率以及音节的持续时间。例如当讲话者打开他的窗户或打开他前面的空调/风扇时,可能发生隆巴德效应。根据本发明的各种实施例,为了对讲话者的隆巴德效应进行补偿,可以使用针对讲话者专用信号处理模块311中的语音水平的目标峰值水平,其取决于讲话者位置处的背景噪声。

在本发明的进一步实施例中,可以针对不同的声学环境来修改ICC系统309中的齿音消除器的特征。齿音消除是旨在减少或消除过量齿谐音(诸如“s”、“z”和“sh”)的方法。齿音典型地存在于2-10kHz之间的、取决于个体状况的任意频率。在示例性实施例中,齿音消除器例如可以至少部分地基于预期的噪声掩盖效应(noise masking effect)来缩放齿音消除算法的侵害性。

根据本发明的各种实施例,为了满足听众的有关音量、音频质量和声学讲话者定位的预期,可以针对若干背景噪声水平来改变ICC系统309中的NDGC的增益特征。例如,通过使用限幅器模块中的噪声特定特征,可以单独地缓和(moderate)每个扬声器信号中的峰值。

对于降噪,典型地在经处理的语音信号中的残余噪声和听觉失真之间做出折衷。这里,根据本发明的多种实施例,可以使用背景噪声的掩盖效应。在通常以响亮声学环境所表征的高速度状态,可以以更加积极地执行降噪这种方式来执行参数化。所导致的失真不太可能被听众察觉,直到某个程度。在低速时,焦点可以放在声音质量上而较少地放在抑制背景噪声上。

在本发明的进一步实施例中,可以将不同的参数集用于均衡,以便平衡语音质量和系统的稳定性。所述参数集中的一个或多个是依据驾驶情况经脱机训练(trained offline)的。当提供了诸如控制器区域网络(CAN)信号的交通工具信号(例如汽车的速度或风扇等级)时,在单纯的传感器驱动信号处理以外,可以使用额外的信息。

可以以诸如VHDL、SystemC、Verilog、ASM等任意常规计算机编程语言来部分地实现本发明的实施例。本发明的替代实施例可以实现为预编程的硬件单元、其它相关的组件,或实现为硬件组件与软件组件的组合。

实施例可以全部或部分地实现为用于与计算机系统一起使用的计算机程序产品。这样的实现可以包括一系列计算机指令,所述一系列计算机指令固定在例如计算机可读介质(例如软盘、CD-ROM、ROM或固定盘)的有形介质上,或者经由调制解调器或其它接口设备(例如通过介质连接到网络的通信适配器)可发送到计算机系统。所述介质可以是有形介质(例如,光学或模拟通信线路)或者是利用无线技术(例如,微波、红外线或其它传输技术)实现的介质。所述一系列计算机指令体现关于该系统在本文中先前所描述的功能的全部或部分。本领域的技术人员应当理解,这样的计算机指令可以以数种编程语言来编写,以与许多计算机架构或操作系统一起使用。此外,这样的指令可以存储在诸如半导体、磁的、光学的或其它存储设备的任意存储设备中,并且可以使用诸如光学的、红外的、微波或其它传输技术的任意通信技术来传输。预期这样的计算机程序产品可以作为具有附属打印或电子文件的可移动介质(例如,收缩包装软件(shrinkwrapped software))进行分发,预加载到计算机系统(例如在系统ROM上或固定盘上),或通过网络(例如互联网或万维网)从服务器或电子公告板来分发。当然,本发明的一些实施例可以实现为软件(例如,计算机程序产品)和硬件二者的组合。本发明的其它实施例实现为完全的硬件或完全的软件(例如,计算机程序产品)。

虽然已经公开了本发明的各种示例性实施例,但是对于本领域技术人员来说显而易见的是,可以在不脱离本发明的真实保护范围的情况下做出将实现本发明的一些优势的各种改变和修改。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号