首页> 中国专利> 用于减轻在数字无线电接收器中的反馈的方法和设备

用于减轻在数字无线电接收器中的反馈的方法和设备

摘要

声学反馈抑制器的实施例确定在音频信号的帧的多个频率带的每一个中的能量。将在多个频率带的每一个中的能量与人的语音的特性作比较,以确定本帧包含不可能的人的语音的内容,并且展现反馈的特性。在确定反馈在出现时,向反馈疑似在出现的频带应用自适应增益降低。

著录项

  • 公开/公告号CN104871436A

    专利类型发明专利

  • 公开/公告日2015-08-26

    原文格式PDF

  • 申请/专利权人 摩托罗拉解决方案公司;

    申请/专利号CN201280077806.X

  • 申请日2012-12-18

  • 分类号H04B7/015(20060101);

  • 代理机构11219 中原信达知识产权代理有限责任公司;

  • 代理人陈依虹;周亚荣

  • 地址 美国伊利诺伊州

  • 入库时间 2023-12-18 10:45:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-16

    授权

    授权

  • 2015-09-23

    实质审查的生效 IPC(主分类):H04B7/015 申请日:20121218

    实质审查的生效

  • 2015-08-26

    公开

    公开

说明书

技术领域

本公开总体上涉及减轻反馈,并且更具体地涉及检测在数字无线 电接收器中的以声为来源的反馈的起点,并且应用抑制滤波以减轻和 减少反馈。

背景技术

通过声路径耦合到输入的输出信号引起音频系统中的反馈,在循 环中创建再生信号,导致不期望的声音。其在从简单公共地址系统到 复杂无线无线电通信系统的所有类型系统中出现。处理反馈声音的传 统方式包括几种手段。一种手段是充分地物理分离输入(例如,麦克 风)和输出(例如,扬声器)以防止再生信号出现。当然,这不总是 可能的。另一种手段是在反馈频率下简单地应用陷波滤波器。该手段 仅在反馈在已知频率下出现时或如果确定频率并且然后应用对应的滤 波器,并且如果滤波器不适当地未影响期望信号的频率内容时有效。 然而,在更复杂的系统中,可以有具有不同的特性的、在不同频率处 出现的各种类型的反馈。先发制人地插入滤波器以处理所有形式的反 馈将是不实用的。因为反馈是再生的,所以经常使用的另一种手段是 改变音频信号的音高以防止再生效应出现。可以移位音高,以避免已 知的谐振频率或频率带,或者,可以确定声音的基础音高和在基础音 高上和下改变声音的基础音高。音高移位是有效的,但是可以经常被 收听者检测到,并且因此不是最佳解决方案。其他方法包括:仅检测 在通过系统的信号的音频频谱中的强音调类信号,并且通过降低音量 来响应,或在反馈频率处应用馅波滤波器。然而,这假定反馈在出现, 这意味着收听者在系统检测到和应用用于处理反馈的措施的时间之前 在听到反馈。

所有的传统方法是有效的,但是具有它们的缺点。它们或要求当 反馈出现时识别反馈,意味着反馈在它被检测到时之前被听到,或者 要求关于频率的预知,使得可以应用所选择的滤波器。

因此,需要一种用于在音频系统中抑制反馈的方法和设备,该方 法和设备比传统方法更快并且以处理不同种类的反馈的自适应方式操 作。

附图说明

在附图中,贯穿独立的视图,相似的附图标号指示相同或在功能 上类似的元件,附图与下面的详细说明一起被包含到说明书中并且形 成说明书的一部分,并且用于进一步说明包括所要求保护的发明的思 想的实施例,并且解释那些实施例的各种原理和优点。

图1是根据一些实施例的发射装置和接收装置的方框图;

图2是根据一些实施例的反馈抑制器的功能方框图;

图3是根据一些实施例的用于检测在信号的中频带区域中的反馈 的方法的流程图;

图4是根据一些实施例的用于检测在信号的低频带区域中的反馈 的方法的流程图;

图5是根据一些实施例的反馈抑制器的功能方框图;

图6是根据一些实施例的由反馈抑制器使用的索引图;

图7是在几个时间从图6的索引图得出的一系列能量索引直方图; 并且

图8是根据一些实施例的执行反馈检测的方法的流程图。

技术人员将明白,为了简单和清楚而示出了在附图中的元素,并 且附图中的元素不一定是根据比例绘制的。例如,在附图中的元素的 一些的尺寸可能相对于其他元素被夸大,以有助于改善对本发明的实 施例的理解。

已经在适当时通过在附图中的常规符号表示了设备和方法构成部 分,附图仅示出了与所示的实施例的理解相关的那些具体细节,以便 不将本公开与对于受益于在此的说明的本领域内的普通技术人员容易 显然的细节混淆。

具体实施方式

实施例包括一种用于减轻无线电接收器中的反馈的方法,该方法 包括各个处理和步骤,诸如在无线电接收器处接收无线电信号,并且 从该无线电信号生成数字音频信号。该数字音频信号被格式化为一系 列帧。该方法还包括:确定数字音频信号的多个频率带的每个中的能 级,并且计算多个频率带的第一频率带的信号能级与该多个频率带的 第二频率带的信号能级的至少一个比率。该方法还包括:确定该至少 一个比率超过阈值,并且至少部分地基于确定该至少一个比率与语音 信号不一致来确定反馈在多个频率带之一中出现,并且向反馈在出现 的频率带应用增益降低。

向反馈在出现的频率带应用增益降低。图1是根据一些实施例的 发射装置102和接收装置104的方框图100。发射装置102和接收装置 104都是双向无线电装置,诸如由公共安全和其他这样的人员常用的那 些。双向无线电装置在半双工模式中操作;用户可以或者说话(发射) 或收听(接收)但是两者非同时(例如,全双工)。双向无线电装置 可以直接地彼此进行通信,而不使用网络,并且也可以被集群化,其 使用联网的基础设施、中继器和其他设备。发射装置102仅示出了发 射器排队,而接收装置104仅示出接收器排队。然而,两个装置将包 含发射装置102和接收装置104的、在此被示出的发射器和接收器组 件两者。

在发射装置102中,麦克风106接收声学声音信号,该声学声音 信号由麦克风106转换为被麦克风放大器110放大的电模拟信号。放 大的模拟信号然后被模数转换器110数字化。上行链路音频处理器块 112格式化由模数转换器110产生的数字信号,以用于诸如通过将数字 样本编组为帧来发射,所述帧然后被噪声抑制器块114处理以减少在 样本中的噪声。从噪声抑制器块114输出的处理的音频样本然后被语 音编码器116语音编码。语音编码器116将语音建模为一组参数,如 例如使用矢量总和激励的线性预测(VSELP)或先进的多频带激励 (AMBE)建模而进行的那样。由语音编码器116产生的编码的语音信 号被提供到发射器118,发射器118将信号调制和通过无线电信道120 发射。无线电信道120可以是在发射装置102和接收装置104之间的 直接信道,或者它可以通过网络、中继器或将信号从发射装置102中 继到接收装置104的其他这样的设备。

接收装置104在接收器122处通过无线电信道120接收数据。接 收器122包含解调器,该解调器解调接收到的信号以获得语音编码信 号,该语音编码信号被发射装置102发射。接收器122向语音解码器 124提供接收到的编码信号,该语音解码器124向由接收器122提供的 信号应用语音解码处理。语音解码器124实质上使由语音编码器116 执行的编码反转,以产生数字音频信号。可以以音频样本的帧来组织 该数字音频信号,该音频样本的帧被声学反馈抑制器126处理。声学 反馈抑制器126处理接收到的音频样本,以检测没有语音的典型特性 并且看起来可能是再生信号分量的起点的信号。声学反馈抑制器126 确定各个频率带中的音频信号的能量,并且可以应用各种测试以确定 音频信号是否具有以在一个时刻和随着时间两者上模仿语音的方式在 音频信号的频谱中分布的能量内容。当相对于频率的音频信号能量分 布被分布使得它不可能是语音时,或者当随着时间能量分布未能像语 音那样作为时,声学反馈抑制器126将降低一个或多个频率带中的增 益。当继续接收该信号时,继续随着时间应用增益降低,直到充分地 减少非语音能量。如果音频信号看起来是语音,但是声学反馈抑制器 126不修改该信号。

声学反馈抑制器126的输出被提供到下行链路音频处理块128, 下行链路音频处理块128可以包括均衡器、自适应/固定增益控制器、 可懂度增强器以及本地声音发生器,诸如用于格式化用于转换为模拟 的数字音频信号的音调、语音通知和舒适噪声产生器。使用数模转换 器130来实现D/A转换。数模转换器130产生模拟音频信号,该模拟 音频信号被输出放大器132放大为选择的音量级。该输出放大器向扬 声器134应用放大的模拟音频信号。扬声器将电模拟音频信号转换为 声学信号,使得近处的收听者可以听到该声音信号。如果接收装置104 与发射装置102充分接近,则可以在发射装置的麦克风106处接收到 扬声器输出136,这可以导致再生反馈。当声音循环通过发射装置102 和接收装置104时,该反馈可以迅速地增加。然而,声学反馈抑制器 126检测音频能量,该音频能量指示音频信号不可能是语音或包括不可 能是语音的能量,并且声学反馈抑制器126向看起来在体验再生反馈 的开始的频率带应用自适应增益降低。

已知在人的发出的语音信号中的能量趋向于在1500Hz下最大。 成人男性语音的基频在125Hz的区域中,成人女性语音具有大约200 Hz的基频,而儿童语音在大约250Hz至400Hz变化。在大约1400Hz 之上,浊音的平均能量(随着时间)以大约每10年6dB减小。诸如在 辅音中的摩擦音的清音在较高的频率处具有大的能量,但是在持续时 间上较短。而且,在诸如双向无线电装置的装置中常用的音频组件的 频率响应趋向于在高频处达到峰值,该高频显著地大于其中在人的语 音中的能量的大部分出现的那些。因此,通常,趋向于在较高频率范 围中比在较低频率具有更高的能量含量的音频信号与语音不一致,并 且可能是反馈的结果。而且,在人的语音中的峰值能量当说话者说话 并且发出不同的声音和词时随着时间移位。因此,如果在中频率带和/ 或低频率带中的能量在不可能是语音的时段上在相同的频率下一致, 则反馈可能出现。抑制通常的人语音的特性允许在此教导的实施例检 测看起来不是语音并且与反馈一致的音频信号。然后可以应用自适应 增益降低以减轻可能在出现的任何反馈。如在此所示,声学噪声抑制 器126在无线电装置的接收器路径104中,但是本领域内的技术人员 将明白,它可以等同地被放置在发射路径102中。

图2是根据一些实施例的反馈抑制器200的功能方框图。在一些 实施例中,反馈抑制器200可以被用作图1的声学反馈抑制器126。由 反馈抑制器200执行的各个处理被抽象为在图2中的方框。每个处理 可以例如被数字信号处理器实施,该数字信号处理器执行被设计成执 行该抽象的处理的适当指令代码。

反馈抑制器200从无线电接收器(例如,接收器122)的解调器 接收编码语音204。语音解码器202解码语音以产生数字音频信号,该 数字音频信号被提供到自适应灵敏度计算块206和窗口化块208两者。 自适应灵敏度计算块206例如通过使用例如平均幅度差函数来确定音 频信号的基频或基本音高。该基频用于动态地选择用于高频带反馈检 测器224的阈值。在浊音上确定该音高。

窗口化块208将解码的语音格式化为样本的窗口或帧。在一些实 施例中,窗口化块208产生10毫秒(ms)长度的帧,该10毫秒(ms) 长度的帧具有解码的语音信号的80(八十)个样本,该解码的语音信 号在解码的语音的80(八十)个样本之前和之后具有24(二十四)个 缓冲样本,以用8KHz采样率产生128个点帧。在逐个帧的基础上处 理每个帧。该帧被时间至频率转换块210处理(例如,数字傅立叶变 换)以产生每个帧的频谱,其被提供到频带能量计算块212。频带能量 计算块212确定在多个限定的频率带的每个中的能量。例如,可以将 频率带限定为:很低频带214,其从接收器的最低频率(例如,0Hz) 到500Hz;低频带216,其从最低频率到1400Hz,或者到在诸如1000 至1400Hz的范围中的频率。该频率带可以还包括从500Hz至2000Hz 的中频带218、从1400Hz到诸如4000Hz的接收器的最高频率的高频 带220、和从2000Hz至最高频率的很高频带222。在此所示的频率带 214-222的大小不意味着与能量含量或幅度成比例,并且在此仅被布置 成示出它们的范围和它们如何可以重叠。

对于每个频带214-222,频带能量计算块212确定在相应的频带中 包含的能量的幅度。频带能量计算被提供到几个频带反馈检测器块的 每个,该频带反馈检测器块包括高频带反馈检测器块224、中频带反馈 检测器块226、和低频带反馈检测器块228。

高频带反馈检测器块224使用自适应灵敏度计算块206的输出来 基于在音频信号中的浊音语音的音高来确定适当的阈值。确定两个比 率:在低频带216中的能量与在高频带220中的能量的比率;以及, 在很低频带214中的能量与在很高频带222中的能量的比率。因为在 人的语音中的能量大部分在较低的频率,所以如果这些比率太低,则 它指示该音频信号包含作为语音的异常的不寻常的高频含量,并且可 以因此是在高频带中的反馈。将在低频带216中的能量与在高频带220 中的能量的比率与第一阈值相比较,并且将在很低频带214中的能量 与在很高频带222中的能量的比率与第二阈值相比较,其中,第一阈 值和第二阈值基于所确定的音高。

中频带反馈检测器块226也确定两个能量比率:在中频带218中 的能量与在很高频带222中的能量的比率、和在中频带218中的能量 与在很低频带214中的能量的比率。在图3中示出中频带反馈检测器 块226的操作,图3是根据一些实施例的用于检测在信号的中频带频 率区域中的反馈的方法300的流程图。在开始302处,已经对于当前 帧(中等至很高和中等至很低)计算两个中频带能量比率。方法300 可以通过下述方式确定是否存在弱中频带反馈出现,如在处理304中 那样:分别将中到很低和中到很高能量比率与中频带弱低阈值和中频 带弱很高阈值相比较。如果所述比率大于这些阈值,则可以出现弱中 频带反馈,并且在处理306中使弱反馈的计数器递增。然后在处理308 中评估该计数器值。该计数器指示弱中频带反馈当随着每个连续帧被 递增时是否已经出现足够长的时段,中频带比率落在该连续帧的各自 的阈值之下。如果中频带比率未落在它们各自的阈值下,则将计数器 复位,如在处理318中那样。如果计数器指示预选数量的连续帧已经 过去并且其中,中频带比率落在它们各自的阈值下,则可以在处理310 中设置弱中频带标记。方法300也在处理310中确定是否存在强中频 带反馈。将中频带比率与分别低于中频带弱低和中频带弱强阈值的中 频带强低和中频带强高阈值相比较。如果中频带能量比率落在中频带 强阈值之下,则在处理314中设置强中频带反馈标记。一旦已经作出 了弱和强中频带反馈确定,则方法300终止316。

返回图2,反馈抑制器200也包括低频带反馈检测块228。在500 Hz(很低频带214)下出现的低频带反馈可能难以检测,因为语音趋向 于在低频带区域中具有显著的能量。然而,语音也随着时间改变,因 此,在语音能量在低频带中高的同时,它随着时间在幅度上改变,而 不像趋向于一致的反馈那样。因此,为了检测低频带反馈,必须检查 随着时间的能量一致性。在图4中示出用于执行低频带反馈检测的方 法,图4示出根据一些实施例的用于检测在信号的低频带频率区域中 的反馈的方法400的流程图。在开始402处,低频带反馈检测器块228 计算几个连续帧的在低频带中的信噪比(SNR)。方法400然后在处理 404中将当前的SNR(SNR(n))与最近的(或其他近期的)帧的SNR (SNR(n-1))相比较。如果在当前和近期SNR水平之间的差小于预选 量(例如,处理404中的“是”),则在处理406中使SNR阈值计数 器递增,否则在处理414中将SNR阈值计数器复位。当使SNR阈值计 数器递增时,在处理408中评估SNR阈值计数器的计数值。如果SNR 递增计数器满足与将指示在低频带中的能量一致的持续时间对应的预 选值,而不是语音将变化的,则已经检测到低频带反馈,如在处理410 中所示,其中,可以对于进一步的操作设置标记。该方法然后对于当 前帧结束412。可以通过多种已知手段来确定SNR。在一些实施例中, 可以将SNR确定为10log(最大低频带能量/最小低频带能量)。

再一次参见图2,一旦已经对于当前帧分别执行了高、中和低频 带反馈检测处理224、226和228,则执行进一步的处理。语音行为检 测器(VAD)块230确定当前帧是否包含语音行为。可以基于在很低 频带214中的时间平滑的最大和最小能量来确定语音行为。如果在很 低频带214中的最大能量和最小能量之间的差大于VAD阈值,则可以 设置VAD标记,用于指示当前帧包含语音,否则,清除标记,用于指 示在当前帧中没有语音。当没有存在并且被VAD 230指示的语音时, 则可以将所有的增益调整复位为归一化水平。

子频带增益产生器232确定要向各个频带214、218、222应用的 增益。可以将整体增益确定为在高频带反馈检测器块224中确定的两 个比率的乘积,该两个比率是低频带216与高频带220以及很低频带 214与很高频带222的能量的比率。这些比率越小,则越可能出现反馈。 可以通过考虑在最新帧中使用的增益连同平滑值来进一步平滑增益。 这允许也当如VAD 230指示那样检测到语音时增益提升。在增益倍增 器块234中,将新的增益因子应用到它们各自的频带。增益相乘的帧 然后在频率至时间转换块236中被转换回时域内,并且输出238是已 经被检查用于反馈的信号,并且当检测到时,已经应用减轻措施以减 少反馈的影响。

图5是根据一些实施例的反馈检测器500的功能方框图。在一些 实施例中,反馈检测器500可以被用作在图1的中声学反馈抑制器126 中的补充或替代处理元件。在一些实施例中,它可以被用于补充和帮 助验证由在图2-4中描述的反馈抑制器执行的反馈检测处理。语音解码 器502可以作为图1的语音解码器124操作,并且解码接收到的编码 语音以产生被窗口化504以产生一系列帧的数字音频信号。每个帧包 含要考虑的多个基于数据的样本,并且可以被填充有零以产生预定长 度的帧。每个时间帧的频率表示(频率帧)被例如快速傅立叶变换块 506产生。该频率帧然后在处理508中被处理以确定在多个频率带或滤 波器组信道的每个中的能量。在一些实施例中,可以对于沿着巴克频 率标度分布的16(十六)个频率带或滤波器组信道确定能量,但是也 可以使用其他频率标度。在确定滤波器组能量时,存储最高滤波器组 信道能量(maxFBE),并且在处理510中将具有最高能量的至少三个 信道分级(例如,第一、第二和第三最高和对应的索引,例如,1至 16)。这些分级的结果连同具有与具有最高能量的信道对应的最低索 引(I=1)的它们的对应的信道索引(maxFBEI[i][j],i=1,…,16,j=1能 量,j=2索引)被存储在表格、阵列、或其他数据结构中。可以同样对 另外的或甚至所有的其他滤波器组能量分级排序。而且,在处理522 中计算平均长期和短期能量。短期能量是当前帧的总的能量(ASTE), 而平均长期能量(ALTE)是在诸如1秒的时段上的多个先前帧的平均 值。

处理510的滤波器组信道能量分级可以在处理512中被用于形成 直方图,以跟踪在某个时段上的滤波器组信道的分级上的改变。特定 信道通常包含在帧中的最大能量的累积计数被存储在与在直方图表格 中的滤波器组信道对应的门(bin)(例如,16个门之一)。在每个直 方图门中的计数被时间加权,使得直方图表示在有限的移动时间窗口 上的滤波器组最大能量出现分布。该时间窗口的长度标称在0.15至1.0 秒之间,这与典型的语音音节的持续时间对应,从直方图,在处理514 中使用公共统计过程来计算在每个滤波器组信道(p[i])和预期值 (pev[i])中出现的最大能量的一组概率。滤波器组信道能量概率连同它 们的索引(maxFBEP[i][1,2],i=1,…,16,j=1概率,j=2索引)然后被 从最高向最低分级排序,使得可以在处理516中用与具有最高能量概 率的信道对应的最低索引(i=1)来容易地识别具有包含最大能量的最 高概率的信道。包含反馈的频带通常展现最高、第二或第三高能量概 率。另外,能量持续时间可以被用作用于检测可能的啸鸣的参数,因 为反馈事件的持续时间通常长于语音音节声音的持续时间,并且因为 它的频带停留更固定。语音的最大声学能量趋向于在时间和频率上比 反馈能量改变得更多。反馈通常在给定的频率带或相邻的频带中具有 更长的持续时间的情况可以被用于进一步在正常语音和反馈的存在之 间区分。最小持续时间限度可以被设置用于检测反馈条件,其中,所 述限度对于较高的频带比在较低的频带中更短。通常,最高能量持续 的语音声音是在较低频率下出现的浊音,所以必须分配更长的停留时 间以区分反馈。因此,可以在处理518中确定用于具有最大能量和能 量概率的每个滤波器组频带的停留时间。这是通过下述方式实现的: 对于每个滤波器组信道保留连续帧的计数,每个滤波器组信道展现具 有最高能量的第一、第二或第三最高概率,并且具有最高能量,如果 信道不满足该准则,则将该计数复位为0。这些停留计数被存储在存储 器阵列maxEcnt[i]和maxPcnt[i]中,其中,i是特定滤波器组信道的索 引。

在处理520中,确定总的帧能量中的、低频带能量(elbPRCNT) 的百分比,该低频带例如在一个实施例中为从80-300Hz的频带,并 且在处理524中,确定高到低频带能量比率(hblbRatio),其中,在 大于500Hz的较高滤波器组信道中的总的能量被除以在低于500Hz 的信道中的能量。注意,可以根据来自图1的块124的解码的输出语 音的总的频率响应而调整这些频率带的限度。不同的音频预先滤波排 队和编码解码响应可以更改图1的解码器输出块124处的整体带通。 反馈检测器逻辑块526评估各个参数和比率的全部。反馈检测器逻辑 由比较测试的序列构成,其中,针对经验得出的阈值常数而比较从信 号导出的参数maxEcnt[i]、maxPcnt[i]、maxFBE、ALTE、elbPRCNT、 hblbRatio、maxFBEI[i][j]和maxFBEP[i][j]。如果比较的逻辑结果为真, 则将啸鸣检测标记(HowlDetFlg)设置为逻辑1,如果否,则将该标记 设置为0。反馈检测器逻辑526的输出是反馈是否在出现的指示,并且 如果如此,则是在一个或多个什么频带中的指示,在处理528中评估 这一点。当反馈在出现时,如例如通过由反馈检测器逻辑526设置来 用于指示这一点的标记所示,可以在适于所检测的反馈的处理530中 应用抑制。通常,增益降低因子被确定,并且被应用到滤波器组信道 (0-15)中的一个或多个,以修改在频域中的每个帧。在应用增益降低 后,如果需要任何一个,则使用逆傅立叶操作将频率帧转换回处理的 时间帧,并且该处理的时间帧然后被转发到例如图1的下行链路音频 处理块128。

在图8中示出在图5的块526中的反馈检测器逻辑的一个实施例 的流程图。注意,图8中所示的阈值参数仅是代表性的,并且不同的 实施例可以使用不同的参数。在处理528中使得可获得反馈最可能出 现的滤波器信道的HowlDetFlg反馈呈现标记和索引。在一个实施例中, 该信息被传送到如在图2中例示的反馈抑制器的一个实施例,并且具 体地说块224、226和228,并且可以被用于补充或取代在这些处理中 执行的反馈检测。在另一个实施例中,图5和8的啸鸣检测器可以使 用另一种装置来抑制和衰减在特定滤波器组信道中的反馈,如在处理 530中那样,而与在图2-4中描述的反馈抑制器的实施例中使用的方法 无关。

图6是根据一些实施例的由反馈抑制器使用的索引图600。图600 将具有最高三个能量的频率带(行)或滤波器信道索引化,其中,频 率沿着垂直轴602增大。每列对应于在固定时段处的信息的帧,其中, 时间沿着水平轴604增大。用实心圆来表示最高能量,用灰色圆来表 示第二最高能量,并且用白色圆圈来表示第三最高能量。图600绘制 作为浊音开始并且然后在高频带中变为反馈的声音突发。从原点到时 段606,最高能量频带集中在低频率带中。在时段606和608之间,在 低频带中的能量减小,这将与以清音终止的声音一致,其中,存在在 中频带中集中的较高能量。从时段608至时段610,并且其后,能量集 中在较高频带中,并且最高能量持续地在一个滤波器组信道612中, 这与反馈或啸鸣一致。

图7是在几个时间从图6的索引图导出的一系列能量索引直方图 700。沿着垂直轴绘制在与沿着图6的垂直轴的滤波器组信道对应的分 立分区中的每个直方图沿着其水平轴的频率、和基于由例如图5中的 处理510执行的分级的在某个时段(例如,多个帧)上的分级的计数。 在一些实施例中,可以通过将一定时段中每个帧的每个滤波器组信道 中的能量求和来产生直方图。直方图702可以表示从原点到图6中的 时段606的能量分布。与浊音一致地,该能量集中在较低滤波器组信 道中。在直方图704中,更集中地分布能量,这例如在图6的时段606 和608之间的时间上一致。当诸如啸鸣的反馈在出现时,如在图6的 时段608和610之间的时间上那样,能量趋向于集中在更少的滤波器 信道中,如I直方图706所指示的。

图8是根据一些实施例的执行反馈抑制的方法800的流程图。方 法800可以作为图5的反馈检测器逻辑526操作。在开始802处,所 考虑的当前帧已经被转换为频率帧。而且,可以在本示例中假定在当 前帧之前,已经对于连续的几个帧执行了处理,使得要确定的各个参 数中存在历史。因此,确定各个参数,如在处理804中那样,包括在 低频带中的能量相对于总的能量的百分比(elbPRCNT)、过去的n个 连续帧的平均长期能量(ALTE)、当前帧的短期能量(ASTE)、高频 带能量与低频带能量的比率(bhlbRatio)、最大滤波器频带能量索引 (maxFBE[i][j])、最大滤波器组能量(maxFBE)、具有最大能量 (maxEcnt[i])的滤波器组信道的连续帧的技术、和具有具有最高能量 的最高概率(maxPcnt[i])的滤波器组的连续帧的计数。

在处理812中执行高频带评估。评估812确定maxEcnt[i]或 maxPcnt[i]是否超过20个帧(在本示例中)、索引编号是否是5或更 高(仅保证在本评估中使用较高频率)、和最大滤波器组能量是否大 于平均长期能量。如果该评估为假,意味着至少一个条件不为真,则 在处理814中清除高频带(HB)持久标记。如果高频带评估为真,意 味着所有的条件为真,则在处理816中设置高频带持久标记(或如果 已经设置了,则不清除)。

在处理806中执行低频带评估。评估806确定maxEcnt[i]是否超 过50个连续帧或maxPcnt[i]是否超过100个连续帧(在本示例中)、 索引编号是否低于5(仅保证在本评估中使用较低频率)和最大滤波器 组能量是否大于平均长期能量。如果该评估为假,意味着至少一个条 件不为真,则在处理810中清除低频带(LB)持久标记。如果低频带 评估为真,意味着所有的条件为真,则在处理808中设置低频带持久 标记(或如果已经设置了,则不清除)。

在处理818中执行高频带反馈检测评估,其确定最大滤波器组索 引概率是否大于3(在这个示例中)或高频带能量与低频带能量比率是 否大于2,并且是否设置了高频带持久标记,和最大滤波器组能量是否 大于平均长期能量的2%。如果高频带反馈检测评估818为真,则在处 理824中设置反馈检测到标记,并且该方法可以终止826。如果高频带 反馈检测评估818为假,意味着至少一个条件不为真,则不设置反馈 检测到标记,并且执行低频带反馈检测评估820。

在处理820中执行低频带反馈检测评估,其确定是否设置了低频 带持久标记,是否设置了低频带持久标记,在低频带中的能量是否是 总的帧能量的至少2%,和最大滤波器组能量是否是平均长期能量的至 少2%。如果低频带反馈检测评估820为真,意味着所有的条件为真, 则在处理824中设置反馈检测到标记。如果低频带反馈检测评估820 为假,意味着至少一个条件不为真,则在处理822中清除反馈检测到 标记,并且该方法终止826。

一旦方法800在826处结束,如果设置了反馈检测标记,那么可 以在将频率帧转换回时域之前将适当的增益降低应用到频率帧。因为 在连续的帧上应用反馈检测和增益降低,所以已经检测到反馈的频率 带将继续减小,直到反馈条件不再明显。因为反馈的再生特性,增益 降低通过反馈环路传播以消除反馈。一旦不再满足反馈条件,则可以 将增益回升到正常水平,或者直到反馈条件再一次明显。

在此例示的实施例具有下述益处:迅速地识别诸如啸鸣的反馈, 但是针对语音的特性评估接收到的音频信号,诸如与低频带相比较在 高频带中具有非正常地高的能量,在形式上持久和持续的低频带能量, 而不是像语音那样更可变。

在前述说明书中,已经描述了特定实施例。但是,本领域内的普 通技术人员明白,在不偏离在所附的权利要求中提出的本发明的范围 的情况下,可以进行各种修改和改变。因此,说明书和附图应被看作 是说明性而不是限定性的含义,并且所有这样的修改意欲被包括在本 教导的范围中。

益处、优点或者对于问题的解决方案或者可以使得任何益处、优 点或者对于问题的解决方案发生或者变得更突出的任何一个或多个元 素不应当被理解为任何或者全部权利要求的关键的、所需要的或者必 要的特征或者元素。本发明被所附权利要求唯一地限定,所附权利要 求包括在本申请的待审期间进行的任何修改和所发出的那些权利要求 的所有等同物。

而且,在本文中,诸如第一和第二与上和下等的关系术语可以唯 一地用于将一个实体或者行为与另一个实体或者行为相区分,而不一 定要求或者暗示在这样的实体或者行为之间的任何实际的这样的关系 或者顺序。术语“包括”、“具有”“包含”或者其任何其他变化形 式意欲涵盖非排他的包含,以便包括、具有、包含一系列元素的过程、 方法、物品或者设备不仅包含那些元素,而且包含未明确地列出或者 这样的过程、方法、物品或者设备固有的其他元素。前有“包括”、 “具有”“包含”的元素在没有更多约束的情况下,不排除在包括、 具有、包含所述元素的过程、方法、物品或者设备中存在另外的相同 的元素。术语“一”和“一个”被定义为一个或多个,除非在此另外 明确地规定。术语“基本上”、“本质上”、“大致上”“大约”或 者其任何其他版本被定义为接近由本领域内的普通技术人员所理解的 那样,并且在一个非限制性实施例中,所述术语被限定为在10%内。 在另一个实施例中在5%内,在另一个实施例中在1%内。在另一个实 施例中在0.5%内。在此使用的术语“耦接”被定义为连接,虽然不一 定直接地连接或者不一定机械地连接。以特定方式“配置”的装置或 者结构至少以那种方式被配置,但是也可以以未列出的方式被配置。

将明白,一些实施例可以由一个或多个通用或者专用的处理器(或 者“处理装置”)和控制所述一个或多个处理器的唯一地存储的程序 指令(包括软件和固件)结合特定的非处理器电路、在此所述的方法 和/或设备的一些、大多数或者全部功能构成,所述一个或多个通用或 者专用的处理器诸如微处理器、数字信号处理器、定制的处理器和现 场可编程门阵列(FPGA)。替代地,可以通过没有存储的程序指令的 状态机、或者在一个或多个专用集成电路(ASIC)中实现一些或者全 部功能,在一个或多个专用集成电路(ASIC)中,每个功能或者特定 功能的一些组合被实现为定制逻辑。当然,可以使用所述两种手段的 组合。

而且,可以将实施例实现为计算机可读存储介质,其上存储了计 算机可读代码,用于对计算机(例如,包括处理器)进行编程以执行 在此所述和所要求保护的方法。这样的计算机可读存储介质的示例包 括但是不限于硬盘、CD-ROM、光存储装置、磁存储装置、ROM(只 读存储器)、PROM(可编程只读存储器)、EPROM(可擦除可编程 只读存储器)、EEPROM(电可擦除可编程只读存储器)和闪速存储 器。而且,预期普通技术人员,虽然可能进行了例如由可用时间、当 前技术和经济考虑驱动的显著努力和许多设计选择,但当由在此公开 的思想或者原理引导时,能够以最少的实验来容易地生成这样的软件 指令和程序以及IC。

提供本公开的摘要以允许读者迅速地确定本技术公开的性质。可 以明白,所述摘要将不用于解释或者限制权利要求的范围或者含义。 另外,在前述具体实施方式中,可以看出,在各个实施例中,将各个 特征分组在一起,以使本公开流畅。这种公开方法不应当被解释为反 映下述意图:所要求保护的实施例需要比在每个权利要求中明确地列 举的特征更多的特征。而是,如所附的权利要求所反映的那样,本发 明的主题在于少于单个所公开的实施例的全部特征。因此,所附的权 利要求在此被并入具体实施方式中,其中每个权利要求本身作为独立 地要求保护的主题。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号