首页> 中国专利> 通过根据背景噪声控制振动器的操作来增强移动通信设备中的语音可懂度

通过根据背景噪声控制振动器的操作来增强移动通信设备中的语音可懂度

摘要

本发明涉及一种移动通信设备,包括:扬声器(14),用于根据语音信号(s(n))来再现语音;振动器(22);用于测量与所述再现的语音相关的背景噪声的装置(24);以及振动器处理单元(16),用于产生取决于所述背景噪声的控制信号,以在语音再现期间根据所述背景噪声的水平控制所述振动器(22)的操作。

著录项

  • 公开/公告号CN101233561A

    专利类型发明专利

  • 公开/公告日2008-07-30

    原文格式PDF

  • 申请/专利权人 皇家飞利浦电子股份有限公司;

    申请/专利号CN200680028114.0

  • 发明设计人 R·M·阿尔特斯;H·J·贝尔特;

    申请日2006-08-01

  • 分类号G10L21/02;H04M1/60;

  • 代理机构永新专利商标代理有限公司;

  • 代理人王英

  • 地址 荷兰艾恩德霍芬

  • 入库时间 2023-12-17 20:28:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-24

    未缴年费专利权终止 IPC(主分类):G10L21/02 授权公告日:20110713 终止日期:20190801 申请日:20060801

    专利权的终止

  • 2011-07-13

    授权

    授权

  • 2008-10-08

    实质审查的生效

    实质审查的生效

  • 2008-07-30

    公开

    公开

说明书

技术领域

本发明通常涉及移动通信设备,更特别地,涉及具有用于在存在环境噪声的情况下增强音频信号输出可懂度的装置的移动通信设备。

背景技术

例如蜂窝式电话的移动通信设备几乎在世界的所有大都市区都得到了广泛使用,并且现在使用移动电话来执行大量的语音通信。然而,由于这些设备的移动性,因此它们在各种各样声环境中的使用存在固有弱点,声环境中的一部分可以是有噪声的。环境噪声可以引起发生于通信的接收端、发射端、或者两者的(无论什么程度)组合中的问题。

众所周知,背景噪声使语音可懂度被降低,这是因为语音可懂度随着信噪比SNR的下降而下降,并且近年来一直在努力改善在恶劣噪声条件下的语音可懂度。例如,美国专利No.6,741,873描述了一种移动通信设备,其中在传声器中确定背景噪声水平并且建立阈值。若超过该阈值,则确定传声器可能正在接收声音能量。因而,若输入信号超过该阈值,则移动通信设备发射输入信号,并且该阈值的变化取决于背景噪声的水平。

然而,本装置并不一定改善在恶劣噪声条件下的语音可懂度;其仅仅试图根据听者的感知,来降低背景噪声相对于语音信号的显著性,从而增加对于听者语音更加可懂的可能性。然而,非常向往的是真正改善移动通信设备中的语音可懂度,以增强其在各种声环境中的性能。

发明内容

因此,本发明的目的是提供一种移动通信设备,其中响应于不同的环境噪声水平来增强语音可懂度。本发明的另一个目的是提供一种用于在移动通信设备中增强语音可懂度的相应方法。

根据本发明,提供了一种移动通信设备,包括:扬声器,用于根据语音信号来再现语音;振动器;用于测量与所述再现的语音相关的背景噪声的装置;以及振动器处理单元,用于产生取决于所述背景噪声的控制信号,以在语音再现期间根据所述背景噪声的水平而控制所述振动器的操作。

有利地,该移动通信设备包括用于计算代表背景噪声水平的背景噪声频谱信号的装置,该振动器处理单元适合于产生该控制信号,以基于该背景噪声频谱信号在语音再现期间选择性地操作振动器。用于测量背景噪声的装置可以包括一个或多个传声器,并且可以根据在从所述一个或多个传声器获得的一个或多个信号中的环境噪声贡献,产生该背景噪声频谱信号。

根据本发明的实施例,根据单个传声器信号来估计所述背景噪声频谱信号。根据本发明的另一实施例,根据多个传声器信号来估计所述背景噪声频谱信号。

该移动通信设备还可以包括:低通滤波器,用于对所述语音信号进行滤波;以及放大器,用于以取决于所述背景噪声频谱信号的增益值乘以所述滤波的语音信号,以产生所述控制信号。此外,它可以包括用于在多个频率上对所述背景噪声频谱进行积分以获得与噪声功率有关的瞬时值的装置;以及用于通过应用预先确定的传递函数来将所述瞬时值转变为所述增益值的装置。

本发明扩展到一种用于增强移动通信设备从语音信号再现的语音的可懂度的方法,所述移动通信设备包括振动器,该方法包括:确定与所述再现的语音相关的背景噪声;产生取决于所述背景噪声的控制信号;以及施加所述控制信号到所述振动器,以在语音再现期间根据所述背景噪声的水平而选择性地操作所述振动器。

本发明的这些和其他方面根据在此所述的实施例将变得明显,并且将参考在此所述的实施例来进行阐述。

附图说明

现在将只通过实例以及参照附图来对本发明的实施例进行描述,在附图中:

图1是示出根据本发明示范性实施例的移动通信设备的主要组件的示意性框图;

图2是示出图1中振动器处理块的主要组件的示意图;

图3是示出根据本发明示范性实施例在语音可懂度增强方法中使用的在单个传声器环境噪声频谱估计过程中的主要步骤的示意性框图;以及

图4是示出根据本发明示范性实施例在语音可懂度增强方法中使用的在多个传声器环境噪声频谱估计过程中的主要步骤的示意性框图。

具体实施方式

本发明提供一种用于通过在语音再现期间使用振动器或振动筛连同杨声器来增强移动通信设备中语音可懂度的方法和部件。在大多数移动电话中振动器已经应用于单独以静音模式或者结合选定的铃声来提醒用户来电和来信息。在本发明中,通过对语音信号的低频部分进行处理并且将其供应给振动器,使振动器以受控方式产生振动,同时扬声器设备正常活动,其中所述处理过程对于不同环境噪声水平使得语音可懂度是最佳的。

参照附图1,输入信号s(n)表示将需要再现的数字语音信号。第一数模D/A转换器10将数字信号s(n)转换到模拟域,之后,将模拟信号通过扬声器放大器12进行放大并供应给扬声器14,用于输出。振动器处理单元16处理同一数字信号s(n),在将处理后的振动器信号通过振动器放大器20进行放大然后供应给振动器22之前,通过第二D/A转换器18将处理后的振动器信号转换到模拟域。振动器处理单元16使用振动器处理算法,其中测得的环境噪声以对于较大噪声水平实现较大输出的方式来驱动该振动器处理算法。使用来自一组M个传声器24的信号来测量该环境噪声,其中M是等于或大于1的整数,这些信号通过各自的传声器放大器26被放大并且通过各自的模数A/D转换器28被转换到数字域。根据M个转换的传声器信号X1(n)到XM(n),由背景噪声频谱处理单元30(如,数字信号处理器)计算环境噪声的频谱,并且将噪声频谱信号|N(f)|供应给振动器处理单元16,供振动器处理算法用来产生振动器信号。

应当领会到的是,代替图1布置中的D/A转换器,可以借助于例如振动器处理单元16中可以具有的装置来产生开关信号,并且本发明并不旨在局限于该方面。此外,尽管只示出一个振动器22,但是例如关于不同频率范围可以提供多个振动器,并且本发明并不旨在局限于该方面。

参照附图2,详细示出了振动器处理单元16中用于根据扬声器信号s(n)产生控制振动器22的信号的主要组件。通过低通滤波器LPF50对数字扬声器信号s(n)进行滤波。合适的滤波器具有在由(1-a)*z/(z-a)给出的z域中的传递函数,其中参数a在0<a<1的范围内。低通滤波后的信号通过可变放大器52乘以增益g(n),并且产生的信号用于控制供应通过振动器22的电流。在本示范性实施例中,根据噪声幅度频谱|N(f)|计算增益g(n),如下。首先,经由积分器54在所有频率上对噪声频谱进行积分,以获得瞬时值PNN,其与噪声功率的平方根相关(即,PNN表示噪声功率的平方根)。注意,还能够通过对|N(f)|2的积分来计算噪声功率,但是这种计算需要乘法,为了本发明,这样做并不一定有大的优点。

然后,处理单元将PNN转变成增益值g(n),如图2所示该处理单元能够计算传递函数58。对于噪声功率的低值(即PNN低于第一阈值T1),振动器22不需要增加语音可懂度,因此g(n)设定为一。对于噪声功率高于特定噪声水平(即PNN高于第一阈值T1),振动器需要随着噪声的增加而增加语音可懂度,因此随着PNN的增加而增加g(n)。当环境噪声处于最高水平时(即PNN高于第二阈值T2),增益g(n)受到振动系统的物理局限性的限制。

传声器信号包括环境噪声和语音贡献,并且在本发明中单个传声器或者多个传声器的环境噪声频谱估计可以用来估计环境噪声幅度频谱|N(f)|。

参照附图3,示意性示出单个传声器噪声频谱估计中采用的主要步骤,其中,基于频谱的最小统计量(spectral minimum statistics)能够根据传声器信号X(n)来估计环境噪声的幅度频谱|N(f)|,所述频谱的最小统计量描述于Reiner Martin的“Spectral subtraction based onminimum statistics”,Signal Processing VII,Proc.EUSIPCO,Edinburgh,1994年9月,第1182-1185页,其中n是采样指数,f是频率指数。首先,在步骤32中,通过串并转换器将数字化的传声器信号X(n)在时间上分割成由B个连续采样构成的块。接着,在步骤34中将由B个采样构成的老块和由B个采样构成的新块连接起来,并且在步骤36中将产生的由2B个连续采样构成的块乘以汉宁窗。在步骤38中通过离散傅立叶变换DFT将窗处理后的信号变换到复值的傅立叶域,然后在步骤40中,通过对每一频率取DFT结果的复值的幅度(即绝对值)来确定传声器信号的幅度。最后,在步骤42中,对于每一频率,在有限的过去时间上执行最小值检索,以得到估计的噪声幅度频谱|N(f)|。该方法找出准稳定的噪声,其中准稳定是指频谱特性只随时间缓慢变化。

参照附图4,示意性示出多个传声器噪声频谱估计中所使用的主要步骤,其中,使用波束形成技术来估计环境噪声的频谱|N(f)|。该技术基于空间选择性从语音中分离出环境噪声,例如所述空间选择性描述于Peter S.K.Hansen的″Signal subspace methods for speechenhancement″,Ph.D.thesis,Technical University of Denmark,1997。因而,在这种情况下,通过滤波器矩阵44对M个数字化的传声器信号X1(n)到XM(n)进行滤波,以便从X1(n)到XM(n)范围内的信号空间中只提取来自预期的用户讲话方向(例如,正对传声器前面)的分量。结果,滤波器矩阵44的输出中的语音-噪声比大于M个传声器中的任何一个。在上述Peter S.K.Hansen的参考文件中给出了对于滤波器矩阵44的示范性设计。当然,在本发明的情况下,并不感兴趣增强的语音,而是感兴趣环境噪声。根据滤波器矩阵的输出,可以计算出闭塞滤波器矩阵46,其闭塞来自用户方向的信号而通过所有其他信号。结果是得到表示环境噪声的信号。为了获得噪声幅度频谱|N(f)|,对信号进行窗处理,通过DFT将其变换到频域,并且最终对于每一频率取绝对值,步骤48结合地表示出这些运算。在上述Peter S.K.Hansen的参考文件中还给出了对于闭塞滤波器矩阵46的示范性设计。

与参照图2所述的单个传声器方法相比较,参照图3所述的多个传声器方法的优点是不但测量准稳定的环境噪声贡献,而且测量非静止的环境噪声贡献。

应当领会到的是,通过使用例如语音动画技术的视觉线索可以进一步增强根据本发明的移动通信设备中的语音可懂度,所述语音动画技术将人的语音转化成表示其的动画片。实时语音识别引擎将人的语音转化成音素,音素是人的语音的基本构成块或原子构成块。动画包实时地取出并且显示每一音素的适当面部表情和视觉符号,以可忽略的延迟创建一套动画片,该动画片与扬声器的声音完全同步。或者,或此外,可以实质上实时地产生并显示话语本身。

应当领会到的是,本发明旨在用于但并不一定局限于移动电话。

应当注意的是,上述实施例说明而不是局限本发明,并且在没有脱离根据所附权利要求定义的本发明的范围的情况下,本领域的技术人员应能设计出许多替代实施例。在权利要求中,任何括号内的附图标记不应当理解为限制权利要求。词语“包括”及类似词语并不排除存在列于任何权利要求或者说明书中作为整体之外的元件或步骤。元件的单个标记并不排除这种元件的多个标记,反之亦然。

可以借助于包括几个截然不同元件的硬件,以及借助于适当编程的计算机来实施本发明。在列举几个装置的设备权利要求中,这些装置中的几个可以具体为一个相同项的硬件。不同的从属权利要求中列举某些措施的这种事实并不指示使用这些措施的组合不具有优点。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号