首页> 中国专利> 具有改进的噪声抗扰性的通信系统、方法和设备

具有改进的噪声抗扰性的通信系统、方法和设备

摘要

本发明公开具有改进的噪声抗扰性的通信系统、方法和设备。在一个实施例中,一种用于改进在通信中的噪声抗扰性的方法,其包括:(1)至少一个计算机处理器确定在所接收的信号中的感兴趣区域;(2)至少一个计算机处理器确定在信号的感兴趣区域内的替代元候选;以及(3)至少一个计算机处理器编码替代元候选作为在除感兴趣区域之外的信号的区域中的替代元。

著录项

  • 公开/公告号CN106170929A

    专利类型发明专利

  • 公开/公告日2016-11-30

    原文格式PDF

  • 申请/专利权人 奥迪马科斯公司;

    申请/专利号CN201580018887.X

  • 发明设计人 H·莱维特;

    申请日2015-02-09

  • 分类号H04B7/24(20060101);

  • 代理机构11245 北京纪凯知识产权代理有限公司;

  • 代理人徐东升;王爽

  • 地址 美国纽约州

  • 入库时间 2023-06-19 00:59:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-23

    授权

    授权

  • 2017-02-08

    实质审查的生效 IPC(主分类):H04B7/24 申请日:20150209

    实质审查的生效

  • 2016-11-30

    公开

    公开

说明书

相关申请

本专利申请要求于2014年2月10日提交的美国临时专利申请号61/938,072和于2014年4月17日提交的美国临时专利申请号61/981,010的优先权权益,其公开内容通过全文引用的方式并入本文中。

技术领域

本申请总体涉及电子通信,并且更具体地涉及具有改进的噪声抗扰性的通信系统、方法和设备。

背景技术

在当今世界中,我们广泛依赖现代通信系统,如蜂窝电话、收音机等。这些设备的普及以及它们在我们日常生活中的重要性只会增加。

发明内容

本发明公开具有改进的对噪声和/或失真的抗噪性的通信系统、方法和设备。在一个实施例中,系统、方法和设备可识别可能被噪声所遮蔽的信号(或多个信号)的一个或多个元素,并且编码(多个)信号(例如,移动(多个)元素至不同频率、域等),使得(多个)信号更可能幸存发送。接收设备(如果启用)对所编码的信号进行解码并且进行附加处理,以增强解码的信号的可懂度和/或质量(例如,放大关键元素、衰减或不再生噪声等)。可编码信号的设备可被称为“启用的设备”。不能启用的接收设备将接收信号,而不感知针对改进的噪声抗扰性的编码。

一个目标是提供其中可在发送至一个或多个接收器之前或在发送至一个或多个接收器期间处理音频信号的系统、方法和设备。附加设备可用于(例如,在中继站)后发送以处理信号。信号处理可提供对发送可在源处存在或在发送期间采集的不期望的噪声和/或失真的音频-视频信号(例如,语音、音乐等)的改进的抗扰性。如本文所用,抗扰性是指一过程,通过该过程信号易受噪声和/或失真的影响。

另一目标是提供系统、方法和设备,其中包括附加信息的处理的音频-视频信号可感知地难以区分未经处理的音频-视频信号,从而改进音频-视频可懂性和/或音质,而不感知地影响用户对于接收未解码经处理的信号的设备的信号质量。

本发明公开用于改进在通信中的噪声抗扰性的方法。在一个实施例中,一种方法可包括:(1)至少一个计算机处理器确定在所接收的信号中的感兴趣区域;(2)至少一个计算机处理器确定在信号的感兴趣区域内的替代元候选;以及(3)至少一个计算机处理器将替代元候选编码为在除了感兴趣区域之外的信号的区域中的替代元(surrogate)。

在一个实施例中,信号可包含音频信号。在另一个实施例中,信号可包含视频信号。在又一个实施例中,信号可包含音频信号和视频信号两者。

在一个实施例中,感兴趣区域可包含在信号内的噪声频带。

在一个实施例中,替代元候选可包含具有低于感兴趣区域内的强度的强度的信号元素。

在一个实施例中,方法可进一步包括使用选自包括傅立叶变换、快速傅立叶变换、离散傅立叶变换、伽柏变换和伽柏-维格纳变换组的变换生成信号的谱表示。

在一个实施例中,将替代元候选编码为除了兴趣区域之外的信号的区域中的替代元的步骤可包括至少一个计算机处理器在信号的相位元素中编码替代元候选。

在一个实施例中,将替代元候选编码为除了感兴趣区域之外的信号的区域中的替代元的步骤可包括至少一个计算机处理器在强频率元素的遮蔽扩展范围内编码替代元候选。

在一个实施例中,将替代元候选编码为除了感兴趣区域之外的信号的区域中的替代元的步骤可包括至少一个计算机处理器在强频率元素的预定范围内编码替代元候选。

在一个实施例中,方法可进一步包括至少一个计算机处理器发送包含替代元的信号至第二设备。

在一个实施例中,方法可进一步包括至少一个计算机处理器从包含替代元的信号生成再生信号;并且发送该再生信号至第二设备。

根据另一实施例,一种用于改进在通信中的噪声抗扰性的方法可包括:(1)至少一个计算机处理器识别在信号中被编码为替代元的替代元候选;(2)至少一个计算机处理器还原在信号中的替代元候选;以及(3)至少一个计算机处理器根据具有还原的替代元候选的信号生成再生信号。

在一个实施例中,方法可进一步包括使用选自包括傅立叶变换、快速傅立叶变换、离散傅立叶变换、伽柏变换和伽柏-维格纳变换的组的变换生成包含替代元的信号的谱表示,并且替代元可在谱表示中被识别。

在一个实施例中,替代元可在信号的相位元素中。在另一实施例中,替代元可在强频率元素的遮蔽扩展范围内。在另一实施例中,替代元可在强频率元素的预定范围内。

在一个实施例中,方法可进一步包括至少一个计算机处理器放大替代元。

在一个实施例中,方法可进一步包括至少一个计算机处理器确定在所接收的信号中的感兴趣区域;以及至少一个计算机处理器衰减在感兴趣区域内的至少一个信号元素的强度。

本发明公开通信设备。在一个实施例中,一种通信设备可包含:存储器;至少一个计算机处理器,其执行以下操作:确定在信号中的感兴趣区域;确定在信号的感兴趣区域内的替代元候选;以及将替代元候选编码为除了感兴趣区域之外的信号的区域中的替代元;以及用于与第二通信设备连通的接口。

在一个实施例中,通信设备可包括用于接收信号的输入设备,如麦克风和相机。在另一实施例中,信号可接收自存储器。在另一实施例中,信号可接收自通信网络。

在一个实施例中,通信设备可包括用于输出再生信号的输出设备,如扬声器和/或显示器。

在一个实施例中,至少一个计算机处理器可进一步识别作为在所接收的信号中的被编码为替代元的替代元候选;还原在信号中的替代元候选;根据具有还原的替代元候选的信号生成再生信号;以及输出再生信号。

在一个实施例中,至少一个计算机处理器可进一步使用选自包括傅立叶变换、快速傅立叶变换、离散傅立叶变换、伽柏变换和伽柏-维格纳变换的组的变换生成信号的谱表示;以及发送谱表示至第二通信设备。替代元候选可在信号的谱表示中被编码。

在一个实施例中,至少一个计算机处理器可进一步根据包含替代元的信号生成再生信号;并且发送再生信号至第二通信设备。

在一个实施例中,至少一个计算机处理器可进一步放大替代元。

在一个实施例中,信号可包含音频信号。在另一实施例中,信号可包含视频信号。在又一个实施例中,信号可包含音频信号和视频信号两者。

在一个实施例中,感兴趣区域可包含在信号内的噪声频带。

在一个实施例中,替代元候选可包含具有低于感兴趣区域内强度的强度的信号元素。

在一个实施例中,替代元候选可在信号的相位元素中被编码。在另一实施例中,替代元候选可在强频率元素的遮蔽扩范围内被编码。在另一实施例中,替代元候选可在强频率元素的预定范围内被编码。

根据另一实施例,一种通信设备可包括存储器和至少一个计算机处理器,其执行以下操作:识别在所接收的信号中的替代元;以及根据所识别的替代元从所接收的信号生成再生信号以及从具有替代元候选的信号生成再生信号。

在一个实施例中,至少一个计算机处理器可进一步还原在信号中的识别替代元。

在一个实施例中,通信设备可包括用于输出再生信号的输出设备,如扬声器和/或显示器。

在一个实施例中,所接收的信号可从第二通信设备接收。在另一实施例中,信号可从存储器接收。在另一实施例中,信号可从通信网络接收。

附图说明

为了更完全地理解本发明、其目的和优点,现在结合附图参见以下说明,其中:

图1示出根据一个实施例对于改进的噪声抗扰性的示例性系统;

图2示出对于启用的发送或接收设备的示例性框图;

图3示出根据一个实施例用于改进噪声/失真抗扰性的示例性方法;

图4A-图4D示出根据一个实施例编码替代元的示例性方法的频谱示例;

图5示出用于编码具有嵌入式替代元的所接收的信号的示例性方法;

图6A和图6B示出根据一个实施例的用于实现窄频带滤波器的示例性方法;以及

图7示出根据使用连续窄频带滤波器组的实施例的用于改进噪声/失真抗扰性的示例性方法。

具体实施方式

本发明的若干实施例及其优点可通过参考图1至图7理解,其中相同的参考数字指代相同元素。本文所公开的实施例可在音频信号传输的复杂情况下的环境中,因为使用在无限时间内涉及集成的变换在有限时间间隔内分析的固有问题,如下所述。这个问题在视频图像中并未发生,这是由于视频信号发送的基本单元“帧”为包括有限数目的信号元素(像素)的有限实体。

一般来讲,傅里叶变换或这种类型的任何其它变换将时间函数转换为频谱。这些变换涉及无限时间(从时间t=-无穷大至t=+无穷大)的平均值。还假设时间函数是平稳的(即,其频谱不随时间变化)。由于本文所述的音频信号可随时间变化,可使用短期频率变换,其中在时间信号中的感兴趣区域乘以有限持续时间的加权函数;例如,有限持续时间的矩形波。这种数学变换可允许时间函数是周期性的假设,其中周期等于时间限制加权函数的持续时间。

这种假设的周期性函数的傅里叶变换确定感兴趣的区域上的时变信号的“短期频谱”。应当认识到,除了周期性信号之外,傅里叶变换的每个应用在分析现实生活的信号时产生短期频谱。然而,当加权函数的持续时间相对长(例如,大于分析音频信号时人耳的平均时间)时并不常常使用术语“短期频谱”。缩写术语“频谱”可替代使用。本文所用术语遵照这种常规用法。

为了考虑时变信号的重要的短期瞬时特性,当需要短持续时间的加权函数时可使用术语“短期频谱”或更常规术语“时间频率元素”。

图1示出根据一个实施例的用于改进的抗噪性的系统。系统100可包括例如发送设备110、通信网络120以及接收设备130和接收设备140。

在一个实施例中,发送设备110和接收设备130/140可以是可发送和/或接收音频、音频/视频和/或包括模拟和数字信号的数据信号的任何合适的设备。示例包括移动电话/设备、固定电话、助听器、个人放大设备、辅助听力设备、视频和音频会议系统、IP语音设备、流式无线电设备、双向无线电设备、平板电脑、台式机和笔记本电脑、工作站、电子阅读设备等。出于本公开的目的,虽然发送设备110和接收设备130/140可以既发送音频或音频/视频信号又接收音频或音频/视频信号,但是每个将根据其在会话或发送的一部分的作用被提及。例如,当开始会话时设备110可作用为发送器并且设备130可作用为接收器,然后随后在会话中切换角色,其中设备130作用为发送器,并且设备110作用为接收器。

通信网络120可允许在发送设备110和一个或多个接收设备130/140之间的通信。示例包括普通老式电话系统(POTS)、蜂窝网络、WiFi网络、因特网、卫星网络、近场通信网络、蓝牙网络及它们的任意组合。根据需要和/或期望可使用任何合适的通信网络。

在一个实施例中,可使得发送设备110在将信号发送至一个或多个接收设备130/140之前能够执行信号处理。

在一个实施例中,可使得接收设备130能够处理/解码所接收的信号,从而改进噪声/失真抗扰性,而接收设备140可不包括此种处理能力。

虽然处理当在发送设备和接收设备处发生时可在本公开中被描述,但是应当认识到处理可涉及可与这些设备分开的附加硬件(未示出)。此外,在通信网络中的附加或替换的硬件(例如,专用中继器、放大器、计算机服务器、中央办公系统、手机信号塔等)可进一步根据需要和/或期望处理通信信号。例如,中继器可处理入射信号以改进其对噪声/失真的抗扰性。相似地,沿着通信路径的发送器可产生和发送(例如)信号的稀疏谱表示,并且可将该稀疏谱表示传送到可执行逆向操作的后续接收器。本文所用“稀疏谱表示”为其中信号的谱分量已被消除的表示。典型的稀疏谱表示可包括例如信号的仅重要的载信息(information-bearing)的谱分量。稀疏谱表示的一个特性在于需要更少的比特或信道容量来分别存储或发送信号的稀疏谱表示。

图2示出启用的发送或接收设备的框图。根据一个实施例,发送或接收设备200可被实现在软件、固件、硬件或其组合中。在一个实施例中,本系统的一部分被实现在作为可执行程序的软件中,并且由特殊数字信号处理器或微型计算机、通用数字计算机(例如,个人计算机、个人数据助理、智能电话、工作站、小型计算机或大型计算机)执行。例如,在一个实施例中,发送或接收设备200可包括经由接口235通信地耦合的处理器205、存储器210、接收器/发送器215、一个或多个输入/输出(I/O)设备230、(用于启用设备的)编码器/解码器225以及用于改进噪声/失真抗扰性的处理器220。本地接口235可以是(例如但不限于)一个或多个如本领域中所公知的总线或其它有线连接或无线连接。

在一个实施例中,接收设备不需要包括编码器/解码器225和用于改进噪声/失真抗扰性的处理器220中的一个或多个。

在一个实施例中,可编码本文所公开的“替代元”以使得如果不能解码或以其它方式处理替代元,则未启用对替代元进行解码的接收设备的用户将不能感知可懂度和/或质量的变化。如本文所用,“替代元”是指被重新编码以出现在信号的另一部分(例如,在不同频率、时间或相区)中的时间-频率信号元素。

图3示出根据一个实施例的用于改进噪声/失真抗扰性的方法。在步骤305中,音频信号为发送做准备。常规信号处理被用来准备用于数字处理的信号。这可包括放大和预白噪声化,以有效利用数字处理器的动态范围。为了避免混叠误差,使用大于在音频信号中的最高频率两倍的采样率。在一个实施例中,音频信号可在发送和接收设备(例如,蜂窝电话、平板电脑、智能电话、双向无线电等)处被接收。在一个实施例中,音频信号可被直接(例如,通过人说话)或间接(例如,经由硬连接或无线磁性连接或电磁连接)等接收。

在一个实施例中,音频信号可包括不期望的噪声/失真。例如,可存在背景噪声(例如,来自电气设备的60Hz“嗡嗡声”、室内环境噪声(如空调、人群噪声、交通、背景声音、回响等))。

在一个实施例中,发送设备可执行可选的信号预处理。例如,可对音频信号采样以为数字处理做准备。信号预处理期间可采用本领域公知的用于改进各种音频信号性能度量(如信噪比、信号强度、频谱形状、响度,音频信号的物理和感知质量)的其它预处理技术。这些常规预处理技术可包括但不限于信号预白噪声化、频率滤波、压缩放大、噪声衰减等。根据需要和/或期望可采用前述常规预处理技术或其它技术中的一个或任意组合。

在步骤310中,可确定一个或多个与信号相关的风险区域或噪声频带。术语“噪声频带”可包括在信号的频带或其它区域(相位、时间、振幅)内的信号的失真以及噪声的添加。在一个实施例中,噪声频带可以是传输信道中的频谱区域或瞬时区域,在其中噪声或其它失真将干扰语音可懂度和/或音质。风险区域可具有与噪声频带相同的频谱和瞬时结构,但是重要差异在于在噪声频带中的干扰是确定的,而在风险区域中的干扰是不确定的但可以以高概率或高可能性发生。在噪声频带或风险区域中的干扰可为随机的(例如,在电子部件中所产生的热噪声)或为确定性的具有可预测的或部分可预测的波形(如周期性干扰(例如,来自电气设备的嗡嗡声))、可预测的瞬态干扰(如由开关电路所产生的滴答声)或由与其它通信信道串扰造成的背景声音。此外,(多个)噪声频带/(多个)风险区域可包括频率、相位振幅或瞬时失真及其组合。

(多个)噪声频带或(多个)风险区域可针对具有“正常”听力的人以及具有听力损失的人来识别。值得注意的是,可存在多于一个噪声频带/风险区域和/或多形式的失真。

在一个实施例中,可预确定(多个)噪声频带或(多个)风险区域,例如,所有低于1000Hz的频率(例如,用于显著环境噪声的常规频率区域)。在另一实施例中,可动态确定(多个)噪声频带或(多个)风险区域,例如,在语音信号中的停顿期间识别背景噪声。在另一实施例中,期望保留的音频信号的任何频率元素可被编码。在又一实施例中,可根据从在通信链路的另一端处的发送器/接收器的反馈确定(多个)噪声频带或(多个)风险区域。根据需要和/或期望可识别噪声频带或风险区域的其它方式。

在步骤315中,可产生信号的稀疏谱表示(或其它低比特表示)。在一个实施例中,虽然稀疏谱表示被指定具有较少比特(即需要较少信道容量发送或存储信号的稀疏谱表示),但信号的稀疏谱表示可以在感知上并非不同于全谱表示。替代元的稀疏谱表示的使用可充分提高编码替代元的效率。

可用于产生稀疏谱表示的合适的变换可包括(例如)傅里叶变换、快速傅里叶变换、离散傅里叶变换、伽柏变换、伽柏-维格纳变换等。根据需要和/或期望可使用任何合适的变换或数学运算。

在一个实施例中,在稀疏谱表示中的频率元素中的每个可具有强度、频率和相位值。

在一个实施例中,为了确定频率元素的强度值,可分析稀疏谱表示的频率元素。随后,频率元素可以以强度值的降序排序。后续处理所选择的频率元素可为最强频率元素的子集。元素的数目可基于根据语音信号的内容或传输路径的噪声频带和风险区域的数目和宽度的预定的数目或动态的数目。在一个实施例中,在信号处理期间的任何适用阶段处可动态选择高强度频率元素。在一个实施例中,所选择的频率元素可具有传送音频信号的最可理解元素的强度。相似地,频率元素的强度值可以预定或动态方式排序。在该实施例中,可分析并且修改频率元素的强度值以改进语音信号的可懂性和/或音质。

根据需要和/或期望可使用用于排序频率元素的其它参数,例如,相位、振幅、功率等。可使用其它类型的元素,如小波、注册(logon)、通过有限持续时间的时间函数调制的频率元素、位于不同的频率区域的瞬时元素或具有时间-频率结构的其它此类元素。用于排序时间-频率元素和决定舍弃或修改哪个时间-频率元素的标准可根据编码或解码信号的所期望的方法而变化。在一个实施例中,不能听得见的低强度时间-频率元素可用包含可用于编码的信息的听不见的时间-频率元素替代元来替换,以改进噪声抗扰性、语音可懂性和/或音质或包括音乐的音频信号的其它预期特性。低强度时间-频率元素可以是听不见的,这是由于被同时发生的更强时间-频率元素遮蔽、或与遮蔽的时间-频率元素在时间和/或频率上接近。在另一实施例中,高强度时间-频率元素而不是低强度时间-频率元素可被修改或消除。在一个实施例中,为了将发送信号或接收信号的动态范围与收听者的听力的动态范围相匹配,对于具降低的听力的动态范围的人(老年人、听力损失的人),最强时间-频率元素可在强度上被降低。

在步骤320中,可确定“替代元候选(surrogate candidates)”。替代元候选为在发送中有可能被丢失的信号元素(频率元素、时间-频率元素或时间元素)。在一个实施例中,替代元候选可为可在(多个)噪声频带或(多个)风险区域内的信号元素。在另一实施例中,替代元候选可为在(多个)噪声频带或(多个)风险区域中有可能丧失(听不见或难以理解)的低强度信号。这些替代元候选可在频率和/或时间上被变换为在一个或多个无风险区域或无噪声区域中的替代元。在无风险区域或无噪声区域中的变换的元素为处于风险的信号元素的替代元(替代元候选)。

如果(多个)噪声频带/(多个)风险区域是未知的、不能可靠地被确定或包含发送信号的全部频谱,那么可使用双重编码,其中在所发送信号中的全部频率元素被编码为替代元。此类实施方式的示例用于将频谱划分为两部分,例如,部分A和部分B。在部分A中的频率元素被编码为部分B中的替代元,并且在部分B中的频率元素被编码为部分A中的替代元。假设在发送中的频率元素的丧失并未超过频谱的50%,在发送中丧失的频谱的任何部分将具有在频谱的其它部分中的替代元。如果多于50%的频谱在发送中可能被丧失,那么可使用三重编码,其中每个频率元素的替代元在信号频谱中的两个其它位置中被编码。根据在编码替代元时使用稀疏频谱技术、或其它低比特表示的效率的条件来使用替代元的多重编码。

在一个实施例中,仅使用例如16个最强频率元素的语音的稀疏谱表示可被编码为替代元,以提供对噪声和/或失真的抗扰性。这种类型的稀疏谱表示听起来几乎与未经处理的语音信号相同。如果使用多于示例16个频率元素,那么稀疏谱表示可在感知上与全谱表示没有什么区分。此类先进信号处理的示例公开于H.Levitt,M.Bakke,J.Kates,A.Neuman&M.Weiss的“Advanced signal processing hearing aids,”Proceedings of the DanavoxJubilee Symposium(Danavox Jubilee研讨会),333-358。哥本哈根:Stougaard Jensen1993以及T.F.Quartieri和R.J.McAulay的″Speech transformations based on asinusoidal model,″IEEE Transactions on Acoustics,Speech and Signal Processing(关于声学、语音和信号处理的IEEE学报)34,1449-1464,1986中。这些文件的公开内容通过全文引用的方式并入。

在步骤325中,替代元候选可在频率和/或时间上被变换到一个或多个无风险区域或无噪声区域,即有可能在噪声频带或风险区域中丢失的信号可被编码为替代元信号元素。在一个实施例中,替代元可在信号的相位元素中编码。在另一实施例中,替代元可在强频率元素的遮蔽的扩展范围(spread-of-masking range)内被编码。例如,替代元可被插入在发送信号中的强频率元素的预定范围内。由于在人耳中向上的遮蔽的扩展远大于向下的遮蔽的扩展,所以替代元可在高于强频率元素的频率的频率(例如,高出50Hz、高出一百分比等)处被放置。替代元可被放置在发送信号中的强频率元素的向上的遮蔽的扩展范围内。为了获得稀疏谱表示根据相对强度排序频率元素的方法可被用于识别充分强以遮蔽替代元的频率元素。然而替代元可被人耳遮蔽或部分遮蔽,它们不会被电子解码器遮蔽。这种将替代元编码到无噪声频谱区域和无风险频谱区域的方法可提高替代元通过有噪声的或失真的传输路径的传输而继续存在的可能性。

在另一实施例中,可使用其它形式的信息隐藏法(steganography)(隐蔽更大范围的信息),来编码关于替代元的数据(例如,替代元的原始频率、强度、相位等)。这些数据可被用于在解码期间再现或调节替代元。以全谱表示编码替代元的稀疏谱表示是信息隐藏法的有效形式,原因在于稀疏谱需要较少比特用于其规格,并且语音、音乐或其它重要的声音的若干稀疏谱可以被隐藏在全谱表示中,而不会被人耳检测到。

在另一实施例中,在若干连续的时间窗中的载信息信号元素的稀疏谱表示(例如在每个窗口中的主要谱峰)可用于对抗噪声突发或衰落(drop out)的影响,其中消除时间窗的整个序列。在完整窗口中的丢失时间窗的稀疏谱表示可被用于再生在丢失窗口中的信号。

在使用不同形式的信息隐藏法的实施例中,音频或音频-视频信号可使用常规的二进制码进行数字化,并且在(多个)噪声频带/(多个)风险区域中的重要载信息信号元素的替代元可被编码在无噪声频带中的数字信号的最低有效位中。

在另一实施例中,替代元可在听力的正常范围之外的频率区域中被编码。在一个实施例中,替代元的频率增加固定偏移(例如,+20KHz)而到听力的听不见的范围。

在另一实施例中,例如,涉及窄带信号(例如,旧电话的3.3kHz的带宽)的发送,在发送的窄带信号的带宽之外的宽带信号的频率可以在发送的窄带信号中被编码。在接收端处,启用的接收器可解码宽带频率元素并且在其原始频率处再生它们,从而在接收端处重建宽带信号。在一个实施例中,宽带信号元素的编码可以使得听者不会感知到信号的可懂度和/或音质上的变化,该听者使用未启用解码替代元的设备。

在窄带传输信道上发送宽带信号的这种方法不同于带宽减少的传统方法,原因在于可使用信息速记(stenography)的形式,其中窄带传输信道的带宽内的载信息频率元素是未受影响的,并且不经受带宽减小的任何形式的信号处理。在一个实施例中,只有微弱的、听不见的频率元素被替换为宽带频率元素的听不见的替代元。根据需要和/或期望可替换其它频率元素。与带宽减小的传统方法的另一区别在于使用未启用解码替代元的设备的个人也可以使用所公开的系统,而不会感知到低带宽信号的可懂性和/或音质上的变化。

在另一实施例中,例如,涉及单声道信号的传输,被称为“立体声共轭”的信号的第二版本可以被编码为在所发送的单声道信号中的替代元。单声道信号的立体声共轭以等同于立体声信号的信道间的振幅差和相位差的方式而在振幅和相位上不同。在接收端处,启用的接收器可以解码立体声替代元并且与单声道信号同步地再现它,以便创建立体声信号。在一个实施例中,立体声替代元的编码可以使得听者不会感知到单声道信号的可懂度和/或音质上的变化,该听者使用未启用对替代元进行解码的设备。

在另一实施例中,瞬时遮蔽可用于编码替代元。例如,载信息时间-频率元素(即,在时间和频率两者中指定的短持续时间的信号元素)可以以强度值的降序排序。替代元可在紧跟在发送信号中的强时间-频率元素后的时间-频率区域中被编码。由于其中高强度信号元素遮蔽跟在其后的低强度信号元素的瞬时遮蔽,替代元将是听不见的。当替代元可对人耳被遮蔽时,对电子解码器它们不会被遮蔽。这种将替代元编码为无噪声时间-频率区域和无风险时间-频率区域的方法可提高替代元通过有噪声的传输路径或失真的传输路径的传输而继续存在的可能性。

可使用上述技术中的一个或多个的组合。此外,根据需要和/或期望可使用用于编码替代元的任何其它合适的方法。

在一个实施例中,替代元的全谱表示而不是最大有效稀疏谱表示可被编码。在另一实施例中,根据需要或期望的抗扰性程度可使用比最大有效稀疏谱表示更多的频率元素以及比全谱表示更少的频谱元素来编码替代元。如果标称无噪声区域不完全是无噪声的,那么低效率但更稳健的稀疏谱表示的使用可为可用的。

遮蔽的扩展对于具有听力损失的人比具有正常听力的人更显著。对于这个群体,强信号附近的遮蔽的扩展范围更大,并且替代元的更多信号元素可在较大的遮蔽扩展范围内被编码。在设计用于听力损失的个人的一个实施例中,可以编码可提高替代元的可懂度和/或质量的附加信号元素。在一个实施例中,可以增加相对于相邻的元音的弱辅音的强度,以提高可懂度和/或音质。

在一个实施例中,替代元的编码可以使得听者不会感知到信号的可懂度和/或音质上的变化,该听者使用未启用对替代元进行解码的设备。

再次参考图3,在步骤330中,可以进行可选的检查,以确定接收设备是否能够接收信号的谱表示或其它编码而不是时域信号。在一个实施例中,如果可以发送谱表示而非时域信号,那么在步骤340中,可以发送信号的谱表示。稀疏谱表示比信号的连续时间函数表示在数字转换、处理和/或发送中可能需要更少比特。这在经由具有有限的信道容量或低信道容量的通信路径发送信号上是特别有利的。发送较少比特而不损失语音可懂度和/或音质也可以提供与通信网络的性能度量相关的额外改进。可实现的改进的性能度量的示例包括但不限于网络利用率、网络吞吐量等。

在一个实施例中,可以不执行在步骤330处可选的检查,并且时域信号可以总是被发送到接收设备。

在步骤335中,如果接收设备不能够接收信号的谱表示或其它编码,或者如果它不能确定接收设备是否能够接收信号的谱表示或其它编码,或者如果不进行可选的检查,那么逆变换可以被应用以再生时间信号,并且时域信号可以被发送至接收设备。逆变换的示例包括但不限于逆傅立叶变换、逆离散傅立叶变换、逆快速傅立叶逆变换、逆伽柏变换、逆伽柏-维格纳变换等。

在一个实施例中,逆频率至时间变换可以被应用到在频域中的信号的全谱表示。然后发送嵌入编码的替代元的再生时间信号。在另一实施方式中,可以导出频域信号的稀疏谱表示、将其变换为时域信号并且进行发送。然而,这种稀疏谱表示将包括用替代元编码的频率元素,并且不是可被发送的最稀疏谱表示。为了感知上与未经处理的信号难以区分,具有最小数目的频率元素的稀疏谱可不包含具有编码的替代元的频率元素。由于需要附加频率元素来编码替代元,具有嵌入替代元的稀疏谱可比没有替代元的谱较少稀疏。在设计以最小化发送信号所需的信道容量的另一实施例中,最低地稀疏谱可以用于最小限度地嵌入的稀疏替代元。使用最小限度的稀疏替代元具有额外的优点,来自若干相邻时间窗的替代元可被嵌入到窗口中,以提供对其中丧失窗口序列的噪声突发或衰落的抗扰性。

随后在步骤335中发送具有编码的替代元的再生时域信号。在步骤340中,如关于步骤330所讨论的,如果接收设备能够接收信号的谱表示或其它编码而非时域信号,谱表示或其它编码可被发送到接收设备。

图4A-图4D示出根据一个实施例编码替代元的方法的示例。图4A示出不编码替代元的所接收的信号的谱表示。时间信号以12kHz的采样率被数字化。离散傅里叶变换被施加到200个样本的时间窗(16.7毫秒的持续时间)。所产生的离散频谱包括针对每个窗口相隔100Hz的60个频率元素(线谱)。蓝色的频率元素代表语音,红色的频率元素代表在源处或在发送中采集的噪声。信号的带宽为6kHz。在低于3kHz的频率区域中存在大量噪声,并且这个频率区域被识别为噪声频带。在3kHz和6kHz之间的频率区域为低噪声区域或“无噪声区域”。

图4B示出在噪声采集之前所发送的信号的稀疏谱表示。在这个示例中,稀疏谱表示包括10个频率元素,每个频率元素对应频谱中的每个主峰。稀疏谱表示中的一个重要特性是每个谱峰包含大量的语音信息,并且如果足够的峰都包含在稀疏谱表示中,产生的从逆频率至时间变换获得的时间信号将感知上难以与原始未经处理的时间信号相区分。降低通信信道中的噪声的影响的有效方法是在(多个)噪声频带/(多个)风险区域中推导谱峰的替代元,并且在(多个)无噪声区域中编码这些替代元。启用的接收设备可解码在接收信号中的替代元,并在转换到其原始频率之后用无噪声替代元替换所接收的信号的噪声频率元素。

图4C示出其中在(多个)噪声频带/(多个)风险区域中的主峰的替代元可在信号的无噪声区域进行编码的实施例。箭头标识无噪声区域中的最大峰。这种强峰产生遮蔽大幅向上的遮蔽扩展。虚线示出高于强峰的频率的频率处的频率元素的可听度的阈值。虚线下方的频率元素是人耳听不见的,但可以由启用的设备进行解码。

在一个实施例中,在噪声频带中的四个主峰可被编码为在虚线下方的区域中的四个替代元频率元素。四个替代元由图4C中的四个绿色频率元素表示。四个替代元的强度分别与在低于25分贝(dB)的噪声频带中的四个谱峰的强度相同。使用25分贝的固定衰减,以便确保没有替代元超过由虚线表示可听度的阈值。替代元频率元素的相位分量被用来编码替代元的原始频率。

图4A示出如果不存在替代元的编码时接收信号的频谱表示,而图4C示出具有编码替代元的接收信号的频谱表示。除了在图4C中的虚线下方的频率元素的水平和相位上的差异之外,两个频谱表示是几乎相同的。虚线下方的频率元素可能是听不见的,并且两个谱表示在被转换回时间信号时可以是感知上难以区分的。

图4D示出在接收的信号已经由启用的设备解码后的谱表示。在本实施例中,在噪声频带中的所有的噪声频率元素已被消除,并且四个解码替代元已在其原始频率和振幅处被再生。所接收的信号谱具有在噪声频带中的稀疏谱以及在低噪声区域中的全谱。解码的其它方法可将放大的解码替代元与衰减噪声频率元素相组合。

另一实施例可使用替代元的较少稀疏编码,以便提高需要高保真再现的音乐和其它音频信号的音质。由于在这个示例中存在一些低噪音区域中的几乎听不见的低水平噪声,解码的信号也将具有一些几乎听不见的低水平噪声,如由附图中的红色频率元素所示。

图5示出用于编码具有嵌入式替代元的接收的信号的方法。在步骤505中,时域信号可以由接收设备接收,并且在步骤510中,如果接收设备是未启用的接收设备,那么该信号为在步骤515中的针对听者的输出,而无需进行替代元的处理或解码。

在步骤520中,如果接收设备为启用的设备,那么可使用在图3的步骤315处采用的变换从接收的时间信号产生谱表示。在一个实施例中,如果直接从发送设备接收谱表示,则可能不需要再生谱表示。

在步骤525中,替代元可通过首先识别哪些频率元素是替代元来恢复,或通过识别哪些频率元素具有编码在其中的替代元来恢复。在一个实施例中,作为替代元或具有编码在其中的替代元的频率元素可以具有编码在相位值中的替代元的原始频率。不是替代元或不具有编码在其中的替代元的频率元素将具有0至360度范围内的相位值。具有大于360度的相位值的频率元素可以被识别为替代元,或者具有编码在其中的替代元,并且超过360度的相位值(以延迟的形式表示)可以是替代元的原始频率。可根据需要或期望来实现强频率元素、相位元素、频率偏移等的遮蔽范围中的其他形式的替代元和识别替代元及其原始频率的任一个。

在步骤530中,可通过在频率和时间上将替代元变换为原始值来还原替代元。在一个实施例中,作为替代元或用替代元编码的频率元素可在应用逆频率至时间变换之前被解码。可在其原始频率处通过替代元消除或降低并且替换在(多个)噪声频带/(多个)风险区域中的频率元素。也可放大替代元。在另一实施例中,可再生在(多个)噪声频带/(多个)风险区域中的频率元素,并且将其与还原的替代元的类似频率元素相组合。在(多个)噪声频带/(多个)风险区域中的噪声接收频率元素与还原的替代元的类似频率元素的组合可在改进可懂度和/或音质的同时提高语音-噪声比。

将(多个)噪声频带/(多个)风险区域中的频率元素与还原的替代元的类似频率元素组合的方法可使用除了放大外或代替放大的其它形式的处理,以便提高语音-噪声比、可懂度和/或音质。信号处理的选择方法可以使接收设备能够将其能够传送的最佳质量的信号传送至启用的设备的用户。

一个实施例涉及其中两个发送频率元素和它们的替代元具有降低的语音-噪声比的情况。该方法将噪声发送频率元素与它们的噪声替代元相组合,以便最大化语音-噪声比。组合两个噪声频率元素的一个有效的方法是使用频率元素的加权和,其中分配给每个频率元素的权重是在该频率元素中的噪声的标准偏差的倒数。

在步骤535中,在将替代元还原到其原始频率后,对应于在步骤520中使用的变换的逆变换可用于再生时间信号。由于上述处理的结果,再生的时间信号可具有改进的语音-噪声比。再生的时间信号可以经由扬声器、耳机或提供信号到接收设备的用户的其他装置传递给用户。

在某些上述实施例中,信号处理通常被描述为在时间至频率变换(如傅立叶变换)之后在频域上被执行。在不涉及使用时间至频率变换和相关的频率至时间逆变换的实施例中,一些或所有信号处理可以在时域中被执行。在时域中操作的优点在于,可能需要较不强烈的信号处理。在一个这样的实施例中,也可使用连续的窄带滤波器组,其中每个滤波器的输出是在窄带滤波器的中心频率处在振幅和相位上缓慢变化的近似正弦信号。具有高水平信号输出的滤波器会遮蔽具有低水平输出的相邻滤波器的信号。可以与在频域处理中使用的方式类似的方式用来自(多个)噪声频带/(多个)风险区域的替代元来替换遮蔽的低水平信号。

在一个实施例中,每个窄带滤波器可为在频域实施例中的频率元素的时域模拟。例如,在频域实施方式中,被称为“基频元素”的最低频率元素具有等于1/持续时间的频率,该持续时间为用于制定频域实施方式的短期傅立叶变换的时间窗的持续时间。下一个较高频率元素具有等于基频元素的频率两倍的频率。下一个较高频率元素具有等于基频元素的频率三倍的频率,等等。在时域模拟中,具有最低频率的窄带滤波器的中心频率等于在频域实施方式中的基频元素的中心频率。下一个较高窄带滤波器的中心频率等于基频元素的中心频率的两倍,下一个较高窄带滤波器的中心频率等于基频元素中心频率的三倍,等等。

时域实施方式的另一优点在于可避免在频域实施方式中窗口间的不连续性的问题。在频域实施方式中,时间信号被划分成使短期频谱分析和相关频域处理能够在每个时间窗内进行的时间窗的序列。计算密集型时间至频率变换(如傅立叶变换)可能需要在相关联的计算密集型频率至时间变换(如傅立叶逆变换)之后进行,以便返回到时域,使得该设备的用户可以收听到处理的信号。然而,在变换回时域时,可在连续时间窗之间的边界处发生不连续。因此,例如重叠相加法的平滑操作可以用来消除在连续时间窗之间的边界处的不连续。平滑特性的示例公开于Smith,S.W.的″Scientists and Engineers Guide toDigital Signal Processing,″1997,加利福尼亚科技出版社(California TechnicalPublishing)中,其公开的内容通过全文引用其的方式并入。

在时域处理中,用于从低水平听不见的信号分量分离高水平频率分量(或利用瞬时遮蔽分离高水平时间至频率分量)的窄带滤波器可在滤波器组的频率响应中引入可感知波动。在实际窄带滤波器中,不可能在通带的任一末端处具有无限衰减速率。超出通带的有限衰减速率被称为“转出(roll off)”。因此,相邻的窄带滤波器将由于每个滤波器的有限转出而重叠。

在模拟频域处理的类比的一个实施例中,每个窄带滤波器的脉冲响应等于在频域实施方式中的相应的频率元素的时间扩大。在另一实施例中,脉冲响应是通过加权函数调制的,以减少在通带外的窄带滤波器的转出。加权函数(如升余弦函数及其它)的讨论在1958,多佛出版公司(Dover Publications,Inc.)的Blackman R.B.和Tukey J.W的TheMeasurement of Power Spectra中提供,其公开内容通过全文引用的方式并入。

在一个实施例中,在连续窄带滤波器组中的波动(ripple)可以通过指定各窄带滤波器的振幅和相位响应来消除,使得当两个或更多个连续的窄带滤波器的输出被加在一起时,在重叠滤波器中的信号加上具有适当振幅的相位,以便产生无波动的组合的频率响应。然而,存在需要考虑这些滤波器的设计的基本限制。例如,在一个实施例中,在滤波器组中的每个窄带滤波器具有理想频率响应,使得两个或更多个邻近的窄带滤波器的组合频率响应没有波动。滤波器的理想频率响应的逆傅里叶变换为滤波器的理想脉冲响应。然而,如果滤波器具有有限带宽,那么相应的脉冲响应将为无限持续时间,其对于实际设备不是理想的。相似地,如果滤波器的脉冲响应为有限持续时间,那么滤波器的频率响应将为无限的。然而,这种基本限制并不排除其中每个窄带滤波器具有有限持续时间的脉冲响应和无限但具有不能感知的理想频率响应的偏差的频率响应的滤波器组,脉冲响应的有限持续时间相当于人耳的平均时间。

每个窄带滤波器的脉冲响应的持续时间可被截断,以使得其持续时间与人耳的平均时间相当。在为具有听力损失的人设计的另一实施方式中,每个窄带滤波器的脉冲响应的持续时间可被截断,以使得其持续时间相当于受损人耳的平均时间。

为了具有可有效编码替代元的滤波器,具有短脉冲响应的追踪关于语音信号的结构的短期变化的滤波器并且同时具有足够小的带宽以有效编码窄频率元素的替代元的滤波器可被使用。图6A和图6B示出用于实现适用于编码接近此基本限制的极限的替代元的窄带滤波器的方法的示例性实施例。该方法的实施方式也考虑人耳的局限性。

参考图6A,在步骤605中,可指定窄带滤波器的理想的频率响应。这种滤波器响应具有有限带宽。在这个实施例中,每个窄带滤波器具有小于听力的临界频带的带宽,并且听力的临界频带的宽度可随着频率增加。测量临界频带的方法公开于(例如)B.C.J.Moore,Anintroduction to the Psychology of Hearing,2013年第六版,学术出版社中,其公开内容通过全文引入的方式并入。在一个实施例中,可使用1/5倍频程(octave)的标称频带。在另一实施例中,可使用具有不随频率变化的带宽(如(例如)在所有频率处50Hz的固定带宽)的滤波器组。窄带滤波器的频率响应在通带中可具有的振幅1。在与相邻的较低频率滤波器的重叠区域中,频率响应可以与正弦的平方(sine2)比例地从0增加到1。在与相邻的较高频率滤波器重叠的区域中,频率响应可以与余弦的平方(cosine2)比例地从1降低到0。相邻的滤波器还可以在重叠区域的相位中,使得在两个滤波器中的信号在重叠区域的所有频率处算术上加至1。因为正弦2+余弦2=1(sine2+cosine2=1),邻近的理想的窄带滤波器的组合频率响应在所有频率处为1,从而避免在组合频率响应中的波动的创建。

在步骤610中,迭代过程可以以i=1发起。在步骤615处,逆傅立叶变换可以被施加到理想的频率响应,以获得滤波器的理想脉冲响应。理想脉冲响应是无限长的,因为滤波器的带宽是有限的。脉冲响应可在步骤620中被截断至与耳朵的平均化时间兼容的持续时间。例如,脉冲响应可被限制于大约20毫秒的持续时间。

在步骤625中,截断的脉冲响应可经受傅里叶变换,以获得滤波器的频率响应。因为已经截断脉冲响应,它不再是理想的脉冲响应,并且所产生的频率响应不再是理想的。然而,这是理想频率响应的近似值。

继续到图6B,在步骤635中,可启动迭代i+1。在步骤640中,在图6A的步骤625中获得的频率响应作为近似值i存储在存储器中。在此阶段,i=1。近似值i具有无限频率响应,因为它是有限持续时间的脉冲响应的傅里叶变换(图6A的步骤625)。在滤波器的标称带宽之外的频率响应的分量虽小但并不是可忽略不计的。

在步骤645中,位于其标称带宽之外的近似值i的频率分量可被消除。此频率响应现在为具有有限带宽的理想频率响应的估计。

在步骤650中,在步骤645处的频率响应可经受逆傅里叶变换以便获得其脉冲响应。由于在步骤645处的频率响应被截断至其标称有限带宽,所以产生的脉冲响应将为无限持续时间。

在步骤655中,无限脉冲响应可被再次截断。在迭代过程的这个阶段,在超过20毫秒的持续时间处在脉冲响应中的能量的量小于当脉冲响应之前在图6A的步骤620被截断时的能量的量。

截断的脉冲响应可在步骤660中经受傅里叶变换以获得频率响应。如前,截断的脉冲响应的频率响应将具有扩展至无限的频率分量,但在滤波器的标称带宽之外的频率响应的分量将小于在之前的迭代中的分量。这种频率响应为对于有限持续时间的脉冲响应的理想频率响应的改进的近似值。可被识别为近似值i+1,并且在步骤665中,可与存储在存储器中的近似值i相比。如果在步骤670处,近似值i+1明显不同于存储在存储器中的近似值i,那么在骤680中,指数i增加1,并且可重复迭代。例如,显著差异可为其中近似值i在感知上不同于近似值i+1的差异。用每次迭代,近似值i+1更接近于理想频率响应。

当达到迭代使得近似值i+1并非在感知上不同于迭代i时,后续迭代并不产生对于意向应用的重要性的进一步改进,并且在步骤675中,可终止迭代过程。

由上述迭代方法设计的滤波器可利用有限脉冲响应最小化滤波器的标称滤波器带宽之外的能量的量。在这个例示性示例中,可使用具有与耳朵的平均时间相当的持续时间的脉冲响应。具有远远大于耳朵的平均时间的有限脉冲响应的滤波器可减少标称带宽的频率分量,甚至进一步却以引入其它感知上更加突出的失真(例如,所处理的信号的明显的混响或滤波器的振铃)为代价。比耳朵的平均时间短得多的脉冲响应可能聚集在对具有窄带滤波器的标称带宽之外的较大频率分量的理想频率响应较差的近似值上。

在另一实施例中,可使用评估在滤波器组的频率响应中的感知波动的减少的感知试验来设计窄带滤波器。在本实施例中,迭代过程可以聚集在可最小化来自在相邻滤波器之间的重叠区域中的理想频率响应偏差的可实现的滤波器上。在这些迭代(步骤670)中的感知比较可比较在每次迭代的波动的感知的减少。此方法直接解决可感知波动的问题,但它不可最小化在具有有限脉冲响应的滤波器的标称滤波器带宽之外的频率分量。

在另一实施例中,迭代过程可用于首先聚集在最小化对于具有有限脉冲响应的滤波器的标称滤波器带宽外的频率分量的情况上,接着进行用于最小化在连续的窄带滤波器组中的波动的感知的迭代过程。这个两阶段的迭代过程可以提供与用于最大化在对于人听力的滤波器中的频率和瞬时分辨率二者的理论极限最接近的实际近似值,接着进行迭代过程,其通过转移与远离相邻滤波器的敏感重叠区域的理想频率响应的最小偏差最小化波动的感知。

在另一实施例中,在步骤670处可使用客观而非感知标准来终止迭代过程。例如,当在迭代i+1上标称滤波器带宽外的频率分量的总和被降低小于在迭代i上获得的预定百分比时,可终止迭代过程。例如,预定百分比可以是较小的。根据需要和/或预期,预定百分比可改变。

图7示出根据其中在时域中执行信号处理的一个实施例的用于改进噪声/失真抗扰性的方法。可使用具有小于听力的标称带的带宽的一组窄带滤波器。例如,可使用具有50Hz的带宽的窄带滤波器。因此,对于具有10,000Hz的总带宽的系统,滤波器组将包括200个滤波器。

在步骤705中,音频信号为发送做准备。这可包括放大和预白化以使有效利用信号处理器的动态范围。可使用模拟和数字信号处理。如果使用数字信号处理,那么为了避免混叠误差,使用大于在音频信号中的最高频率两倍的采样率。

在一个实施例中,可在发送和接收设备处(例如蜂窝电话、平板电脑、智能电话、双向无线电或任何合适的设备)接收音频信号。在一个实施例中,音频信号可被直接(例如,由人说)或间接(例如,经由硬连接或无线磁性连接或电磁连接)等接收。

在步骤710中,可识别(多个)噪声频带/(多个)风险区域。这可类似于上述步骤310。

然后在步骤715处确定替代元候选。在一个实施例中,如果(多个)噪声频带/(多个)风险区域是已知的,那么替代元候选可为那些窄带滤波器在(多个)噪声频带/(多个)风险区域的区域中的输出。在另一实施例中,如果(多个)噪声频带/(多个)风险区域是未知的,那么每个窄带滤波器的输出为替代元候选。在其中(多个)噪声频带/(多个)风险区域是未知的另一实施例中,可足以编码Maskee滤波器输出的替代元,以便获得对噪声和/或失真的抗扰性。

如上所述,用于编码仅最强滤波器输出的替代元的原因在于,实验证据表明使用多于16个最强频谱元素的稀疏谱表示的实验证据在感知上几乎难以与语音的全谱表示区分。在一个实施例中,它可因此足以编码(例如)20个Maskee滤波器输出的替代元,而不是编码所有滤波器输出的替代元,以便当(多个)噪声频带/(多个)风险区域是未知时获得对噪声和/或失真的抗扰性。根据需要和/或期望来选择频率元素的数量和/或Maskee滤波器输出。

在步骤720中,可获得每个滤波器的短期输出水平。短期输出水平为在转换为dBSPL的每个滤波器的输出处的能量的滑动平均。相当于人耳的平均时间的平均时间可用于确定在每个窄带滤波器的输出处的短期能量。

在步骤725中,窄带滤波器的输出水平可根据它们的相对水平被排序。在步骤730中,具有最高输出水平的滤波器被识别为“遮蔽滤波器”。在一个实施例中,可识别具有最高输出水平的20个滤波器;可根据需要和/或期望识别其它数量的滤波器。

由于排序可随时间改变,所以排序可(例如)被定期更新。在其它实施例中,在用于获得输出水平的平均时间内排序可更新两次或更多次。当存在相对于滤波器被识别为Maskee滤波器的改变时,这样做获得平滑过渡。具有最高输出水平的滤波器(例如,20个滤波器)也可以与稀疏谱表示可用于有效表示语音相同的方式来表示语音信号。

在步骤735中,由更强Masker滤波器遮蔽的具有低输出电平的滤波器被识别为Maskee滤波器。Maskee滤波器的输出是听不见的,并且可在步骤740中被编码的替代元替换。编码的替代元也可以是听不见的。编码的替代元的格式的方法不同于编码未经处理的滤波器输出的方法,使得启用的接收器能够识别哪个滤波器输出已被编码的替代元替换。

具有编码的替代元的音频信号可在步骤745中被传递至发送设备,并且在步骤750中由启用的接收设备接收。

在一个实施例中,可在步骤755中分析接收信号以确定哪个滤波器输出包含编码替代元。如果接收器未启用,则在没有进一步处理的情况下将发送的滤波器输出传递到用户。在一个实施例中,接收信号的编码可以使得使用未启用解码替代元的设备的听者不会感知到信号的可懂度和/或音质的变化。

在步骤760处,可解码替代元并且在频率和时间上将替代元转换回原始值。可在其原始频率处通过替代元消除或降低并且替换在(多个)噪声频带/(多个)风险区域中的接收信号中的滤波器输出。

在一个实施例中,也可放大替代元。在另一实施例中,可再生在(多个)噪声频带/(多个)风险区域中的滤波器输出,并且将其与还原的替代元进行组合。在(多个)噪声频带/(多个)风险区域中的噪声滤波器输出与还原的替代元的类似频率元素的组合可在提高可懂度和/或音质的同时提高语音-噪声比。

在(多个)噪声频带/(多个)风险区域中的滤波器输出与还原的替代元的类似频率元素相组合的方法可使用除了放大外或代替放大的其它形式的处理,以便提高语音-噪声比、可懂度和/或音质。信号处理的选择方法可以使接收设备以能够提供其所能的最佳质量的信号至启用的设备的用户。

一个实施例涉及其中发送滤波器输出和它们的替代元都具有降低的语音-噪声比的情况。该方法组合噪声发送滤波器输出与它们的噪声替代元,以便最大化语音-噪声比。组合两个噪声频率元素的一个有效的方法是使用频率的元素,其中分配给每个频率成分的权重是在该频率元素中的噪声的标准偏差的倒数的加权和。

前述说明性示例描述对于改进对音频信号的噪声和/或失真的抗扰性的实施例。对于说明性示例选择音频信号,因为使用涉及无限时间的变换分析和处理无限持续时间的音频信号的更大复杂性。用于改进对音频信号的噪声和/或失真的抗扰性的方法可以应用于具有较少困难的视频信号。在类似于用于音频信号发送中噪声抗扰性的一个实施例中,每个视频图像被分为两个区域:i)噪声/风险区域,其中噪声或失真将发生或有可能发生,由于在不完美的通信网络中发送或存储的原因,以及2)无噪声区域,其中噪声和/或失真是极不可能的。重要的载信息的像素,例如识别图像中的两个对象之间的边界或眼睛对其特别敏感的亮度或颜色的快速变化的像素,被识别,并且这些像素的替代元被编码并存储在无噪声区域中。无噪声区域可在相同的图像帧或相邻的图像帧中。在一个实施例中,可存储替代元,以便由在遮蔽范围内的更强像素而对人眼遮蔽。在另一实施例中,替代元可以被存储在数字化图像的最低比特中。

视频显示器具有有限的动态范围,并且在一个实施例中,可编码替代元以超出显示器的动态范围,即替代元可看起来与在显示器动态范围的任一端处的白色或黑色像素相同,但电子解码器可提取递送至超出视频显示器的动态范围的像素的信息。使用模拟或数字信号的信息隐藏的其它方法可根据需要或期望用于存储或检索替代元。

各种技术可用于提供各种组件(例如,处理器、存储器等等)之间的通信,以及根据需要和/或期望允许各组件与任何其它组件通信(例如,使得组件可以获得进一步的指令,可以访问和使用远程存储器存储等)。用于提供此类通信的此类技术可包括例如网络、互联网、内联网、外联网、LAN、以太网、经由手机信号塔或卫星的无线通信或提供通信的任何客户端服务器系统。此类通信技术科使用任何合适的方案,如TCP/IP、UDP或OSI。因此,设想多种不同构型。

在下文中,将描述本发明的系统、设备和方法的实施方式的一般方面。

本发明的系统或本发明的系统的一部分可以“处理部件”的形式,如通用计算机。如本文所用,术语“处理部件”被理解为包括至少一个处理器,其使用至少一个存储器。至少一个存储器存储指令集。指令可永久性或暂时性地被存储在处理器的存储器中。处理器执行存储在存储器中的指令以便处理数据。指令集可包括各种指令,其执行特定任务,如上述任务。用于执行特定任务的此类指令集可表征为程序、软件程序或简易软件。

如上指出,处理机执行存储在存储器中的指令以处理数据。这种数据处理可响应于处理机的用户的命令,响应于(例如)另一处理机和/或任何其它输入的请求。

如上指出,用于实现本发明的处理机可为通用计算机。然而,上述处理机也可利用各种其它技术中的任一技术,包括专用计算机、计算机系统,包括(例如)微型计算机、小型电脑或主机、编程的微处理器、微控制器、外围集成电路元件、CSIC(客户专用集成电路)或ASIC(专用集成电路)、精简指令集计算机(RISC)或其它集成电路、逻辑电路、数字信号处理器、可编程逻辑设备如FPGA、PLD、PLA或PAL,或能够实现本发明的过程的步骤的任何其它设备或设备的布置。这些处理机中的任何或所有可以以各种设备实现,如移动电话/设备、陆线电话、助听器、个人放大设备、辅助收听设备、视频和音频会议系统、IP语音设备、流发射无线电设备、双向无线电设备、平板电脑、台式机和笔记本电脑、工作站、电子阅读设备等。

用于实现本发明的处理机可利用合适的操作系统。因此,本发明的实施例可包括运行iOS操作系统、OS X操作系统、Android操作系统、微软WindowsTM8操作系统、微软WindowsTM7操作系统、微软WindowsTMVistaTM操作系统、微软WindowsTMXpTM操作系统、微软WindowsTMNTTM操作系统、WindowsTM2000操作系统、Unix操作系统、Linux操作系统、Xenix的操作系统、IBM>TM操作系统、惠普UXTM操作系统、Novell>TM操作系统、Sun微系统SolarisTM操作系统、OS/2TM操作系统、BeOS的TM操作系统、Macintosh操作系统、Apache操作系统、OpenStepTM操作系统或其它操作系统或平台的处理机。

可以理解的是,为了实施如上所述的本发明的方法,处理机的处理器和/或存储器物理地位于相同的物理或地理位置中是没有必要的。也就是说,由处理机使用的处理器和存储器中的每个可以位于地理上不同的位置并且连接从而以任何适当的方式进行通信。另外,认识到处理器和/或存储器中的每个可由不同物理块的设备构成。因此,处理器为在一个位置处的单台设备并且存储器为在另一位置处的另一单台设备是没有必要的。也就是说,可以预期处理器可为在两个不同的物理位置处的两件设备。设备的两个不同部分可以以任何合适的方式连接。另外,存储器可以包括在两个或多个物理位置处的存储器的两个或更多个部分。

为了进一步解释,如上所述处理由各种部件和各种存储器执行。然而,可以理解的是,根据本发明的另一实施例如上所述由两个不同的组件执行的处理可以由单个组件执行。另外,如上所述由一个不同组件执行的处理可由两个不同组件来执行。以类似方式,根据本发明的另一实施例如上所述由两个不同存储器执行的存储器存储可以由单个存储器部分执行。此外,如上所述由一个不同存储器部分执行的存储器存储可由两个存储器部分执行。

另外,各种技术可用于提供各种处理器和/或存储器之间的通信,以及允许本发明的处理器和/或存储器与任何其他实体进行通信;即,以便例如获得进一步的指令或访问和使用远程存储器存储。用于提供此类通信的此类技术可包括例如网络、互联网、内联网、外联网、LAN、以太网、经由手机信号塔或卫星的无线通信或提供通信的任何客户端服务器系统。此类通信技术科使用任何合适的方案,如TCP/IP、UDP或OSI。

如上所述,指令集可用于本发明的处理中。指令集可为程序或软件的形式。软件可为(例如)系统软件或应用软件的形式。软件也可为(例如)独立程序的集合或在较大程序内的程序模块或程序模块的一部分的形式。使用的软件也可包括以面向目标程序设计的形式的模块化程序设计。软件告知处理机如何处理正在处理的数据。

此外,可以理解的是,用于本发明的实施方式和操作中的指令或指令集可为合适的形式,使得该处理机可读取指令。例如,形成程序的指令可为适当的编程语言的形式,该编程语言被转换为机器语言代码或目标代码,以允许一个或多个处理器来读取指令。即,使用编译器、汇编器或解释器将以特定的编程语言的程序代码或源代码的写入线转变为机器语言。机器语言是二进制编码的机器指令,其对特定类型的处理机是特异的,即例如对特定类型的计算机特异的。计算机理解机器语言。

根据本发明的各种实施例可使用任何合适的编程语言。例示性地,使用的编程语言可包括例如汇编语言、Ada、APL、Basic、C、C++、COBOL、dBase、Forth、Fortran、Java、Modula-2、Pascal、Prolog、REXX、Visual Basic和/或JavaScript。此外,单一类型的指令或单一的编程语言连同本发明的系统和方法的操作一起使用是没有必要的。相反,如必要和/或期望可以利用任何数量的不同编程语言。

此外,在本发明的实践中所使用的指令和/或数据可利用任何压缩或加密技术或算法,如可期望的。加密模块可用于对数据进行加密。此外,例如可使用适当的解密模块对文件或其它数据进行解密。

如上所述,本发明可以以处理机的形式被说明性地实施,包括计算机或计算机系统,例如其包括至少一个存储器。但应该理解的是,指令集,即例如使计算机操作系统执行上述操作的软件,根据需要可以被包含在各种各样的媒介或介质中的任一上。另外,由指令集处理的数据也可能被包含在各种各样的媒介或介质中的任一上。也就是说,特定的介质,即在处理机中的存储器,例如用于保存本发明所使用的指令集和/或数据可以采取各种各样物理形式或传输中的任一。示例性地,介质可以是纸、纸透明胶片、压缩盘、DVD、集成电路、硬盘、软盘、光盘、磁带、RAM、ROM、PROM、EPROM、电线、电缆、光纤、通信信道、卫星传输、存储卡、SIM卡或其它远程传输,以及可以由本发明的处理器读取的任何其他介质或数据源的形式。

另外,在实现本发明的处理机中使用的一个或多个存储器可以是各种各样的形式中的任一形式,以允许存储器保存指令、数据或其它信息,如所希望的。因此,存储器可以是数据库的形式以保存数据。该数据库可使用文件的任何期望的布置,如平面文件布置或关系数据库布置。

在本发明的系统和方法中,可利用各种“用户接口”以允许用户与用于实现本发明的一个或多个处理机连接。如本文所用,用户接口包括任何硬件、软件或硬件与软件组合,其由允许用户与处理机连接的处理机使用。用户接口可以是例如对话屏幕的形式。用户接口还可包括鼠标、触摸屏、键盘、小键盘、语音阅读器、声音识别器、对话屏幕、菜单框、列表、复选框、拨动开关、按钮或允许当它处理指令集和/或提供具有信息的处理机时用户接收关于操作处理机的信息的任何其它设备中的任一个。因此,用户接口是在用户和处理机之间提供通信的任何设备。通过用户接口由用户提供到处理机的信息可以是例如命令、数据选择或一些其它输入的形式。

如上所述,通过执行指令集的处理机利用用户接口,使得处理机为用户处理数据。通常通过处理机使用用户接口,为与用户连接以传达信息或从用户接收信息。然而,应该理解,根据本发明的系统和方法的一些实施例,人类用户实际上与通过本发明的处理机所使用的用户接口连接是没有必要的。相反,还可以预期,本发明的用户接口可能会与其它处理机而不是人类用户连接(即传达和接收信息)。相应地,其他处理机可被表征为用户。此外,可以预期,在本发明的系统和方法中利用的用户接口可以与另外的一个或多个处理机部分连接,同时还与人类用户部分连接。

本领域的技术人员将易于理解本发明易受广泛的实用性和应用的影响。在不偏离本发明的主旨或范围的情况下,除本文所描述的实施例外,本发明的许多实施例和改型以及众多的变化、修改和等同布置都是可以从本发明及其先前描述中明显看出或是可以由其合理建议。

因此,虽然已经相对于其实施例在此详细描述了本发明,但是应当理解,本发明仅为本发明的说明性和示例性,并且做出本发明以提供本发明的能够实现的发明。因此,前述方法并不旨在解释或限制本发明或以其它方式排除任何其它此类实施例、改型、变型、修改或等同构造。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号