首页> 中国专利> 通过在来自多个麦克风的信号之间智能地进行选择而改善声音质量

通过在来自多个麦克风的信号之间智能地进行选择而改善声音质量

摘要

通过利用多个麦克风来俘获声音信号而改善声音信号接收,所述声音信号接着经加权以动态地调整信号质量。分别从第一和第二麦克风获得第一声音信号和第二声音信号,其中所述第一和第二声音信号源自一个或一个以上声音源。获得所述第一声音信号的第一信号特性(例如,信号功率、信号信噪比,等等),且获得所述第二声音信号的第二信号特性。基于所述第一和第二声音信号的相应第一和第二信号特性,对所述第一和第二声音信号进行加权或缩放。接着组合所述经加权的第一和第二声音信号,以获得输出声音信号。

著录项

  • 公开/公告号CN101911723A

    专利类型发明专利

  • 公开/公告日2010-12-08

    原文格式PDF

  • 申请/专利权人 高通股份有限公司;

    申请/专利号CN200980101496.9

  • 申请日2009-01-29

  • 分类号H04R3/00(20060101);

  • 代理机构11287 北京律盟知识产权代理有限责任公司;

  • 代理人刘国伟

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-18 01:18:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-03-18

    授权

    授权

  • 2011-01-19

    实质审查的生效 IPC(主分类):H04R3/00 申请日:20090129

    实质审查的生效

  • 2010-12-08

    公开

    公开

说明书

技术领域

各种特征涉及通过利用多个麦克风来俘获信号且使信噪比最大化而改善声音接收。

背景技术

移动装置(例如,移动电话、数字记录器、通信装置,等等)常常由不同用户以不同方式来使用。此使用上的多样性可显著地影响移动装置的语音接收性能。使用移动装置的方式随用户的不同而变化且对于同一用户来说随时间的不同而变化。用户具有不同的通信需要、对于功能性的偏好和使用习惯,其可导致移动装置在操作期间在不同位置中被使用或保持。举例来说,一个用户可能喜欢在使用装置以在扬声器电话模式中谈话时将所述装置颠倒地放置。在所述情况下,在移动装置的麦克风与用户之间可能不存在视线(LOS),这可能影响语音信号接收。在另一实例中,可能以使得麦克风对所要语音信号的接收受到阻碍或妨碍的方式放置或定位移动装置。在又一实例中,移动装置可由多个用户使用。在所述情况下,来自个别用户的语音信号可最好地由不同麦克风俘获。举例来说,第一麦克风可最好地从第一用户接收第一声学信号,而第二麦克风可最好地从第二用户接收第二声学信号。

用户可使用移动装置的不同方式常常影响移动装置的麦克风对所要声音或语音信号的接收,从而导致声音或语音质量降级(例如,信噪比(SNR)降低)。在语音通信中,尤其是在移动语音通信中,语音或声音质量是服务质量(QoS)的判断标准。使用移动装置的方式是可潜在地影响QoS的许多因素之一。

因此,需要一种解决方案,尽管存在用户可定位或定向移动装置的不同方式,但所述解决方案仍改善移动装置处的语音或声音接收。

发明内容

提供一种用于改善移动装置上的声音接收的方法。可从第一麦克风获得第一声音信号且可从第二麦克风获得第二声音信号,其中第一和第二声音信号中的每一者可包括来自第一声音源的第一源信号的至少一部分。第一声音信号和第二声音信号可在重叠时间窗内被获得且可包括第一源信号和一个或一个以上其它源信号与噪声的独立混合物。

第一麦克风与第二麦克风可定位于移动装置的不同表面上。可获得第一声音信号的第一信号特性(例如,信号功率、信噪比(SNR)、信号能量、相关性等等,和/或其组合和/或衍生物)。类似地,可获得第二声音信号的第二信号特性(例如,信号功率、信噪比(SNR)、信号能量、相关性等等,和/或其组合和/或衍生物)。亦即,第一和第二信号特性两者均可与相同信号特性相关联。可基于第一和第二信号特性而对第一和第二声音信号进行加权。可接着组合经加权的第一和第二声音信号以获得输出声音信号。

可在经由通信网络将输出信号发射到既定收听者之前对输出声音信号执行额外信号处理。额外信号处理可包括回音消除、噪声降低、自动增益控制和编码中的至少一者。通信网络可为无线通信网络。

根据一个特征,可将第一声音信号分段为第一多个连续帧且可将第二声音信号分段为第二多个连续帧。可获得第一声音信号的第一多个连续帧的第一多个信号特性。类似地,可获得第二声音信号的第二多个连续帧的第二多个信号特性。可对第一多个信号特性和第二多个信号特性执行第一和第二声音信号的加权和组合。

根据一个实例,第一和第二声音信号的加权可包括:(a)对第一信号特性和第二信号特性进行比较;(b)如果第二声音信号与第一声音信号相比提供更好的声音质量,则通过零来缩放第一声音信号且通过一来缩放第二声音信号;和/或(c)如果第一声音信号与第二声音信号相比提供更好的声音质量,则通过一来缩放第一声音信号且通过零来缩放第二声音信号。如果在当前使用第一声音信号的情况下第二信号特性比第一信号特性大至少最小阈值量,则可执行通过零来缩放第一声音信号和通过一来缩放第二声音信号。类似地,如果在当前使用第二声音信号的情况下第一信号特性比第二信号特性大至少最小阈值量,则可执行通过一来缩放第一声音信号和通过零来缩放第二声音信号。

根据另一特征,可确定第一声音信号的第一信噪比且可确定第二声音信号的第二信噪比。如果第一信噪比大于第二信噪比,则可对第一声音信号进行加权以与第二声音信号相比提供对输出声音信号的更大作用。类似地,如果第二信噪比大于第一信噪比,则可对第二声音信号进行加权以与第一声音信号相比提供对输出声音信号的更大作用。可通过以下步骤来获得第一信噪比:(a)将第一声音信号分段为第一多个连续帧;(b)获得第一声音信号的第一多个连续帧的第一多个连续信号功率;和/或(c)在第一多个连续帧的多个连续信号功率中搜索最小信号功率以获得噪声底限估计,使用所述噪声底限估计将获得第一信噪比。可类似地获得第二信噪比。

又一特征可提供:(a)校准第一和第二麦克风以具有大体上相同的灵敏度;(b)如果第一信号特性大于第二信号特性,则对第一声音信号进行加权以与第二声音信号相比提供对输出声音信号的更大作用;和/或(c)如果第二信号特性大于第一信号特性,则对第二声音信号进行加权以与第一声音信号相比提供对输出声音信号的更大作用。第一和第二信号特性可为信号功率。

如果第二声音信号提供优于第一声音信号的经改善的声音质量,则所述方法可包括:(a)通过掺合第一声音信号与第二声音信号而从第一声音信号转变为第二声音信号;和/或(b)逐渐地减小第一声音信号的作用且增加第二声音信号的作用。根据线性函数可减小来自第一声音信号的作用且可增加来自第二声音信号的作用。或者,根据非线性函数而减小来自第一声音信号的作用且增加来自第二声音信号的作用。

根据一个特征,第一和第二麦克风可选自移动装置上的三个或三个以上麦克风中的多个麦克风,其中此选择是基于三个或三个以上麦克风中的哪一者具有最好的信号质量而执行。

在又一实例中,可从至少一个额外麦克风获得至少一个额外声音信号,其中所述至少一个额外声音信号包括来自第一声音源的第一源信号的至少一部分。可获得所述至少一个额外声音信号的至少一个额外信号特性。

可基于第一信号特性、第二信号特性和至少一个额外信号特性而对至少一个额外声音信号以及第一和第二声音信号进行加权。可组合经加权的第一声音信号、第二声音信号和至少一个额外声音信号以获得输出声音信号。

提供一种移动装置,其包含:第一和第二麦克风以及信号选择模块。第一麦克风可经配置以获得第一声音信号。第二麦克风可经配置以获得第二声音信号,其中第一和第二声音信号中的每一者包括来自第一声音源的第一源信号的至少一部分。信号选择模块可经配置以或适于:(a)获得第一声音信号的第一信号特性;(b)获得第二声音信号的第二信号特性;(c)基于第一和第二信号特性而对第一和第二声音信号进行加权;和/或(d)组合经加权的第一和第二声音信号以获得输出声音信号。第一和第二信号特性两者均可与相同信号特性相关联。可在重叠时间窗内从声学信号获得第一声音信号和第二声音信号,且第一和第二麦克风定位于移动装置的不同表面上。

移动装置还可包括信号处理器和发射器。信号处理器可经配置以或适于对输出信号执行回音消除、噪声降低、自动增益控制和编码中的至少一者。发射器可经配置以或适于经由无线通信网络发射经处理的输出信号。

根据一个方面,移动装置可进一步包含:(a)第一模拟到信号转换器,其经配置以或适于将第一声音信号分段为第一多个连续帧;和/或(b)第二模拟到信号转换器,其经配置以或适于将第二声音信号分段为第二多个连续帧。信号选择模块可进一步经配置以或适于:(a)获得第一声音信号的第一多个连续帧的多个连续信号特性;和/或(b)获得第二声音信号的第二多个连续帧的第二多个连续信号特性。可基于第一多个信号特性和第二多个信号特性来执行第一和第二声音信号的加权和组合。

根据另一方面,信号选择模块可进一步经配置以或适于:(a)对第一信号特性和第二信号特性进行比较;(b)如果第二声音信号与第一声音信号相比提供更好的声音质量,则通过零来缩放第一声音信号且通过一来缩放第二声音信号,和/或如果第一声音信号与第二声音信号相比提供更好的声音质量,则通过一来缩放第一声音信号且通过零来缩放第二声音信号。另外,信号选择模块可进一步经配置以或适于:(a)如果在当前使用第一声音信号的情况下第二信号特性比第一信号特性大至少最小阈值量,则执行通过零来缩放第一声音信号和通过一来缩放第二声音信号;和/或(b)如果在当前使用第二声音信号的情况下第一信号特性比第二信号特性大至少最小阈值量,则执行通过一来缩放第一声音信号和通过零来缩放第二声音信号。

根据另一特征,信号选择模块可进一步经配置以或适于:(a)确定第一声音信号的第一信噪比;(b)确定第二声音信号的第二信噪比;(c)如果第一信噪比大于第二信噪比,则对第一声音信号进行加权以与第二声音信号相比提供对输出声音信号的更大作用;和/或(d)如果第二信噪比大于第一信噪比,则对第二声音信号进行加权以与第一声音信号相比提供对输出声音信号的更大作用。

根据又一特征,信号选择模块可进一步经配置以或适于从移动装置上的三个或三个以上麦克风中的多个麦克风中选择第一和第二麦克风,其中此选择是基于三个或三个以上麦克风中的哪一者具有最好的信号质量而执行。

在一些配置中,信号选择模块可进一步经配置以或适于:(a)从至少一个额外麦克风获得至少一个额外声音信号,其中至少一个额外声音信号包括来自第一声音源的第一源信号的至少一部分;(b)获得至少一个额外声音信号的至少一个额外信号特性;(c)基于第一信号特性、第二信号特性和至少一个额外信号特性而对至少一个额外声音信号以及第一和第二声音信号进行加权;和/或(d)组合经加权的第一声音信号、第二声音信号和至少一个额外声音信号以获得输出声音信号。

因此,提供一种移动装置,其包含:(a)用于从第一麦克风获得第一声音信号的装置;(b)用于从第二麦克风获得第二声音信号的装置,其中第一和第二声音信号中的每一者包括来自第一声音源的第一源信号的至少一部分;(c)用于获得第一声音信号的第一信号特性的装置;(d)用于获得第二声音信号的第二信号特性的装置;(e)用于基于第一和第二信号特性而对第一和第二声音信号进行加权的装置;和/或(f)用于组合经加权的第一和第二声音信号以获得输出声音信号的装置。所述移动装置还可包括:(a)用于对输出信号执行回音消除、噪声降低、自动增益控制和编码中的至少一者的装置;和/或(b)用于经由无线通信网络发射经处理的输出信号的装置。

根据一个方面,所述移动装置还可包括:(a)用于对第一信号特性和第二信号特性进行比较的装置;(b)用于如果第二声音信号与第一声音信号相比提供更好的声音质量则通过零来缩放第一声音信号且通过一来缩放第二声音信号的装置;和/或(c)用于如果第一声音信号与第二声音信号相比提供更好的声音质量则通过一来缩放第一声音信号且通过零来缩放第二声音信号的装置。

又一特征提供移动装置,其包括:(a)用于如果第一信号特性大于第二信号特性则对第一声音信号进行加权以与第二声音信号相比提供对输出声音信号的更大作用的装置;和/或(b)用于如果第二信号特性大于第一信号特性则对第二声音信号进行加权以与第一声音信号相比提供对输出声音信号的更大作用的装置。

还提供一种电路,其中所述电路适于:(a)从第一麦克风获得第一声音信号;(b)从第二麦克风获得第二声音信号,其中第一和第二声音信号中的每一者包括来自第一声音源的第一源信号的至少一部分;(c)获得第一声音信号的第一信号特性;(d)获得第二声音信号的第二信号特性;(e)基于第一和第二信号特性而对第一和第二声音信号进行加权;和/或(f)组合经加权的第一和第二声音信号以获得输出声音信号。所述电路可进一步适于或经配置以:(a)如果第二声音信号与第一声音信号相比提供更好的声音质量,则通过零来缩放第一声音信号且通过一来缩放第二声音信号;和/或(b)如果第一声音信号与第二声音信号相比提供更好的声音质量,则通过一来缩放第一声音信号且通过零来缩放第二声音信号。又一方面提供电路,其进一步适于:(a)如果第一信号特性大于第二信号特性,则对第一声音信号进行加权以与第二声音信号相比提供对输出声音信号的更大作用;和/或(b)如果第二信号特性大于第一信号特性,则对第二声音信号进行加权以与第一声音信号相比提供对输出声音信号的更大作用。在一个实例中,可将所述电路实施为集成电路。

还提供一种计算机可读媒体,其包含用于改善声音信号接收的指令,所述指令在由处理器执行时致使处理器:(a)从第一麦克风获得第一声音信号;(b)从第二麦克风获得第二声音信号,其中第一和第二声音信号中的每一者包括来自第一声音源的第一源信号的至少一部分;(c)从三个或三个以上麦克风中的多个麦克风中选择第一和第二麦克风,其中此选择是基于三个或三个以上麦克风中的哪一者具有最好的信号质量而执行;(d)获得第一声音信号的第一信号特性;(e)获得第二声音信号的第二信号特性;(f)基于第一和第二信号特性而对第一和第二声音信号进行加权;和/或(g)组合经加权的第一和第二声音信号以获得输出声音信号

附图说明

从以下结合附图陈述的详细描述可更明了本发明的方面的特征、特性和优点,附图中相同参考字符始终做出相应识别。

图1说明用于经改善的声音/语音信号接收的具有两个麦克风的移动电话102的实例。

图2说明用于经改善的声音/语音信号接收的具有两个麦克风的折叠式移动电话202的实例。

图3是说明具有两个或两个以上麦克风且经配置以提供经改善的声音/语音信号接收的移动装置的一个实例的框图。

图4是说明在具有两个麦克风且经配置以组合来自麦克风的两个输入声音信号以改善声音/语音信号接收的移动装置上操作的方法的流程图。

图5是说明在具有两个或两个以上麦克风且经配置以在两个输入声音信号之间进行选择以改善声音/语音信号接收的移动装置上操作的方法的流程图。

图6是说明移动装置可如何基于信噪比而在来自不同麦克风的两个或两个以上输入声音信号之间进行选择以改善声音质量的框图。

图7是说明在移动装置上操作以基于信噪比监视来执行麦克风选择的方法的流程图。

图8图解地说明用于麦克风信号内的最小信号功率的搜索过程的实例。

图9是说明在移动装置上操作以基于信噪比监视而对从两个麦克风俘获的声音信号进行加权的方法的流程图。

图10是说明可经配置以基于信号功率而在来自不同麦克风的两个输入声音信号之间进行选择以改善声音质量的移动装置的框图。

图11是说明在移动装置上操作似基于信号功率监视来执行麦克风选择的方法的流程图。

图12是说明在移动装置上操作以基于信号特性来动态地调整信号权重的方法的流程图。

图13和图14说明用于在第一信号与第二信号之间进行切换以获得输出声音信号的转变曲线的实例。

图15是说明移动装置可如何对来自不同麦克风的多个输入声音信号进行加权以提供输出声音信号的框图。

图16是说明在移动装置上操作以执行两个或两个以上麦克风的信号加权的方法的流程图。

具体实施方式

在以下描述中,给出具体细节以提供对配置的详尽理解。然而所属领域的技术人员将了解,可在无这些具体细节的情况下实践所述配置。举例来说,可在框图中展示电路以便不会以不必要的细节混淆所述配置。在其它例子中,可详细展示众所周知的电路、结构和技术以便不混淆所述配置。

而且应注意,所述配置可描述为一描绘为流程图、流图、结构图或框图的过程。虽然流程图可将操作描述为顺序过程,但操作中有许多可并行或同时执行。另外,操作的次序可重新布置。当过程的操作完成时过程终止。过程可对应于方法、函数、程序、子例程、子程序等。当过程对应于函数时,其终止对应于所述函数向调用函数或主函数的返回。

在一个或一个以上实例和/或配置中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么功能可作为一个或一个以上指令存储在计算机可读媒体上或经由计算机可读媒体而发射。计算机可读媒体包含计算机存储媒体和通信媒体两者,包含任何促进计算机程序从一个地方向另一地方的转移的媒体。存储媒体可为任何可由通用或专用计算机存取的可用媒体。借助于实例而非限制,此计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以用指令或数据结构的形式携载或存储所要程序代码装置且可由通用或专用计算机或者通用或专用处理器或电路存取的任何其它媒体。而且,任何连接均适当地称为计算机可读媒体。举例来说,如果软件是使用同轴电缆、光纤电缆、双绞线对、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源发射的,那么同轴电缆、光纤电缆、双绞线对、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义内。如本文所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字通用光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。

而且,存储媒体可表示一个或一个以上用于存储数据的装置,包含只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储媒体、光学存储媒体、快闪存储器装置和/或其它用于存储信息的机器可读媒体。

此外,配置可由硬件、软件、固件、中间件、微码或其任何组合实施。当以软件、固件、中间件或微码实施时,用以执行必要任务的程序代码或代码段可存储在计算机可读媒体中,例如存储媒体或其它存储装置。处理器或电路可执行必要任务。代码段可表示过程、函数、子程序、程序、例程、子例程、模块、软件包、类或指令、数据结构或程序语句的任何组合。代码段可通过传递和/或接收信息、数据、自变量、参数或存储器内容而耦合到另一代码段或硬件电路。信息、自变量、参数、数据等可经由任何合适的方式传递、转发或发射,所述方式包含存储器共享、消息传递、权标传递、网络发射等。

一个特征提供将多个麦克风安装在移动装置上,所述移动装置经配置以智能地选择和/或组合来自多个麦克风的声音信号以改善声音信号接收的质量。当移动装置俘获到声音信号时,其可动态地选择来自麦克风中的一者的声音信号,或其可动态地组合多个声音信号以获得经改善的或最佳的信号质量。

通常,分别从第一和第二麦克风获得第一声音信号和第二声音信号,其中第一和第二声音信号源自一个或一个以上声音源。获得第一声音信号的第一信号特性(例如,信号功率、信噪比(SNR)、信号能量、相关性等等,和/或其组合和/或衍生物),且获得第二声音信号的第二信号特性(例如,信号功率、信噪比(SNR)、信号能量、相关性等等,和/或其组合和/或衍生物)。基于第一和第二信号特性而对第一和第二声音信号进行加权。亦即,可通过零(0)与一(1)(包括零(0)和一(1))之间的值来缩放第一和第二信号。所述权重可为相加达恒定值(例如,一)的分数值。接着组合经加权的第一和第二声音信号以获得输出声音信号。在一个实例中,特定麦克风或输入声音信号可通过以下步骤而被选择为输出声音信号:通过一(1)来缩放输入声音信号,而通过零(0)来缩放来自其它麦克风的信号,借此消除其对输出声音信号的作用。在其它实例中,来自不同麦克风的输入声音信号根据(例如)其相应信噪比或信号功率而缩放,且经组合(例如,相加)以产生输出声音信号。

图1说明用于经改善的声音/语音信号接收的具有两个麦克风的移动电话102的实例。第一麦克风104可定位在移动电话102的前表面上。第二麦克风108可定位在移动电话102的与前表面相反的背表面上。可选择第一麦克风104和第二麦克风108的地点,使得用户可能同时阻挡两个麦克风的可能性非常小。

图2说明用于经改善的声音/语音信号接收的具有两个麦克风的折叠式移动电话202的实例。第一麦克风204可定位在移动电话202的前表面上。第二麦克风208可定位在移动电话202的与前表面相反的背表面上。可选择第一麦克风204和第二麦克风208的地点,使得用户可能同时阻挡两个麦克风的可能性非常小。

尽管将图1和图2所说明的移动装置展示为包括在相反的前表面和背表面上的两个麦克风,但其它配置可包括定位在移动装置的不同位置处、不同表面上和/或不同地点的额外麦克风。通过使用在不同位置、表面和/或地点处的多个麦克风,可俘获声音或音频信号,以便可探测信号分集以改善整体声音接收和/或噪声消除。

对于图1和图2所说明的移动电话102和202来说,移动电话可经配置以智能地选择由麦克风中的一者所俘获的信号或组合两个或两个以上所俘获的声音信号以改善或最大化输出信号声音质量。在操作期间,移动电话102和202可针对第一和第二声音信号两者监视一个或一个以上信号特性(例如,信号功率、信号能量、信噪比,等等)。可接着对第一和第二声音信号进行加权以(a)将最好信号选择为输出信号,或(b)将每一信号的一部分作用于输出声音信号。

在操作期间(例如,在呼叫期间),如果移动电话102和202确定来自第二麦克风的声音信号比第一麦克风的声音信号好(例如,第二麦克风上的信号与第一麦克风上的信号相比具有更好的SNR),则其可切换以处理由第二麦克风俘获的声音信号且将声音信号发射到远端收听者。类似地,如果移动电话102和202确定由第一麦克风俘获的声音信号比第二麦克风的声音信号好(例如,第一麦克风上的信号与第二麦克风上的信号相比具有更好的SNR),则其切换回以处理来自第一麦克风的信号且将信号发射到远端收听者。或者,可根据声音信号的相应权重来组合声音信号,而非切换到最好信号。亦即,具有更好的声音质量的声音信号与具有较低的声音质量的声音信号相比可被加权的程度更大。术语“声音信号”包括(但不限于)音频信号、话音信号、噪声信号和/或其它类型的可由麦克风以声学方式发射和俘获的信号。尽管本文中的各种实例可描述移动电话和移动装置,但也可将各种特征实施在数字记录器、通信装置、处理器、电路和其它类型的装置上。

图3是说明具有两个或两个以上麦克风且经配置以提供经改善的声音/语音信号接收的移动装置的一个实例的框图。移动装置302可用以促进用户与远程收听者之间经由(例如,无线或有线)通信网络304的通信。移动装置302可包括至少两个麦克风306和308以及至少一个扬声器310。麦克风306和308可从一个或一个以上声音源301、303和305(例如,一个或一个以上用户)接收声学信号输入312和314,声学信号输入312和314接着由模/数转换器316和318数字化以获得声音信号。在一些配置中,可使用多个额外麦克风307以从不同方向俘获声学信号313,以便改善声音接收和/或噪声消除。举例来说,关于一些配置,可将多个麦克风安装在移动装置的不同表面上、两个或两个以上表面之间的相交处和/或不同位置处。可通过模/数转换器来类似地使来自额外麦克风307的声学信号313数字化以获得额外声音信号。在一些实例中,移动装置302可经配置以或适于选择和使用来自可供装置使用的多个麦克风(例如,三个或三个以上)中的麦克风的子集(例如,第一和第二麦克风)。

由一个或一个以上麦克风306、307和308接收的声学信号可为来自一个或一个以上声音源301、303和/或305的至少一个源信号和/或噪声的组合和/或混合物。来自声音源301、303和/或305中的每一者的源(原始)声学信号可采用不同路径以到达麦克风306、307和308中的每一者。当来自两个或两个以上声音源301、303和/或305的源声学信号跨越不同声学路径而从声音源301、303和/或305朝向两个或两个以上麦克风306、307和308传播时,其可相加、组合或混合。两个或两个以上麦克风306、307和308俘获所得(经混合)的声学信号。所得(经混合)的声学信号由两个或两个以上麦克风306、307和308中的每一者俘获为声音信号且经处理(例如,加权、滤波和/或组合)以改善所俘获的信号的质量。

信号选择和/或组合模块320可实施一算法,所述算法动态地(a)在两个或两个以上经数字化的声音信号之间进行选择和/或(b)基于一个或一个以上因素而根据动态地获得的权重来组合两个或两个以上经数字化的声音信号,以实现输出声音信号的最好声音或音频质量。输出声音信号可随后由补充信号处理器322处理,补充信号处理器322执行(例如)回音消除、噪声降低、自动增益控制和/或编码。经处理的输出声音信号接着由发射器/接收器模块323经由通信网络304发射。举例来说,可经由无线通信网络以无线方式发射经数字化的声音信号。类似地,移动装置302可经由通信网络304接收声音信号,声音信号可在通过数字到模拟转换器324之前由补充信号处理器322处理。所接收信号接着传递到至少一个扬声器310,因此,其可作为声学信号输出326而以声学方式发射到用户。

在一些配置中,信号选择和/或组合模块320可连续地或周期性地对两个或两个以上经数字化的声音信号进行比较,以确定如何最好地获得、选择和/或产生输出声音信号。亦即,信号选择和/或组合模块320可获得两个或两个以上经数字化的声音信号的一个或一个以上信号特性,且将权重指派到每一声音信号以获得所要输出声音信号。

当从一个信号组合转变为另一信号组合时,可逐渐增加和/或减小每一信号的权重以避免输出声音信号的突然改变。在调整权重以在两个或两个以上信号之间进行选择/切换的配置中,信号选择模块320可在信号切换之间等待最小时间量,或其可等待直到第二信号相对于第一信号改善最小阈值,以避免在麦克风之间进行不必要的频繁切换。

图4是说明在具有两个麦克风且经配置以或适于组合来自麦克风的两个输入声音信号以改善声音/语音信号接收的移动装置上操作的方法的流程图。从第一麦克风获得第一声音信号(402)。从第二麦克风获得第二声音信号,其中第一和第二声音信号中的每一者包括来自第一声音源的第一源信号的至少一部分(404)。亦即,可从来自一个或一个以上声音源的一个或一个以上声学信号获得第一和第二声音信号。第一和第二麦克风可定位在移动装置的不同表面上。可在重叠时间窗内获得第一声音信号和第二声音信号。可获得第一声音信号的第一信号特性(406),且可获得第二声音信号的第二信号特性(408)。举例来说,所述信号特性可包括噪信比、信号功率等等中的一者或一者以上。可基于第一和第二信号特性而对第一和第二声音信号进行加权(410)。可组合经加权的第一和第二声音信号以获得输出声音信号(412)。可在经由通信网络将输出声音信号发射到既定收听者(416)之前对输出声音信号执行额外信号处理(414)。此额外信号处理可包括(例如)回音消除、噪声降低、自动增益控制和编码中的至少一者。

通过调整第一和第二声音信号的权重,图4所说明的方法可用以(a)组合第一和第二声音信号以产生输出声音信号,和/或(b)在第一和第二声音信号之间进行选择。此使移动装置能够从一个或两个麦克风获得信号以更好地从一个或一个以上声音源俘获声音,而不管其是单个声音源(例如,单个用户)还是多个声音源(例如,向不同麦克风中讲话的不同用户)。

在一个实例中,可将第一声音信号分段为第一多个连续帧且可获得第一多个连续帧中的每一帧的信号特性,借此获得第一多个信号特性。类似地,可将第二声音信号分段为第二多个连续帧且可获得第二多个连续帧中的每一帧的信号特性,借此获得第二多个信号特性。因此,可(a)在第一和第二声音信号的对应帧之间在逐帧的基础上或(b)在逐帧集合的基础上执行第一和第二声音信号的加权和/或组合,其中每一帧集合具有多个帧。

在图3所说明的实例中,由模/数转换器316和318取样的经数字化的声音信号可通过一个或一个以上缓冲器(例如,其可为选择模块320的一部分或为相异模块)以将其分段为帧。所述缓冲器可具有存储构成一帧的多个信号样本的预设大小。可将模/数转换器和对应缓冲器称作信号分段器。可接着对第一声音信号和第二声音信号的对应帧执行第一声音信号的第一信号特性与第二声音信号的第二信号特性之间的比较。所述信号特性可包括(例如)信号功率、信噪比(SNR)、能量、相关性其组合和/或其衍生物。

在其它配置中,可使用两个以上麦克风。可从至少一个额外麦克风获得至少一个额外声音信号,其中所述至少一个额外声音信号可包括来自第一声音源的第一源信号的至少一部分。可获得至少一个额外声音信号的至少一额外多个信号特性。可基于第一多个信号特性、第二多个信号特性和至少一额外多个信号特性而对至少一个额外声音信号以及第一和第二声音信号进行加权。可组合经加权的第一声音信号、第二声音信号和至少一个额外声音信号以获得输出声音信号。

图5是说明在具有两个或两个以上麦克风且经配置以在两个或两个以上输入声音信号之间进行选择以改善声音/语音信号接收的移动装置上操作的方法的流程图。可经由第一麦克风接收声学信号以获得第一声音信号(502)。类似地,可经由第二麦克风接收另一声学信号以获得第二声音信号(504)。第一和第二麦克风可定位在移动装置的不同地方,使得第一和第二声音信号可展现不同信号特性(例如,不同信噪比或信号功率)。可将第一声音信号与第二声音信号进行比较(506)以确定第一声音信号与第二声音信号相比是否提供更好的声音或音频质量(508)。如果第一声音信号提供更好的声音质量,则选择第一声音信号(510)。否则,选择第二声音信号(512)。可在经由通信网络将所选择的声音信号发射到既定收听者(516)之前对所选择的声音信号执行额外信号处理(例如,背景噪声移除,等等)(514)。

在各种实例中,在来自第一麦克风的第一声音信号与来自第二麦克风的第二声音信号之间的选择可基于其相应信噪比或信号功率而执行。

在对第一声音信号和第二声音信号进行比较且在两个信号之间进行选择时,加权方案可适于执行信号切换。可获得对应于第一声音信号的第一帧或帧集合的第一信号特性和对应于第二声音信号的第二帧或帧集合的第二信号特性。可接着对第一和第二信号特性进行比较。如果第二声音信号与第一声音信号相比提供更好的声音质量(如其相应信号特性所指示),则可通过零来缩放第一声音信号且可通过一来缩放第二声音信号。否则,如果第一声音信号与第二声音信号相比提供更好的声音质量,则可通过一来缩放第一声音信号且可通过零来缩放第二声音信号。

在一个实例中,如果第二信号特性比第一信号特性大至少最小阈值量,则可通过零来缩放第一声音信号且可通过一来缩放第二声音信号。类似地,如果第一信号特性比第二信号特性大至少最小阈值量,则可通过一来缩放第一声音信号且可通过零来缩放第二声音信号。最小阈值量将滞后特性引入到第一声音信号与第二声音信号之间的切换,以避免频繁的不合需要的切换。亦即,通过引入最小阈值量使从一个声音信号到另一声音信号的切换发生得较缓慢和/或较不频繁。

基于SNR监视的麦克风选择

图6是说明移动装置可如何基于信噪比而在来自不同麦克风的两个或两个以上输入声音信号之间进行选择以改善声音质量的框图。一个或一个以上声音源601、605和609(例如,用户,等等)可产生被感知为声学输入信号602、603和604的一个或一个以上声学信号(例如,语音、音频、音乐,等等)。在所述一个或一个以上声音源601、605和609中,一些声音源可提供合乎需要的声音信号(例如,来自移动装置的用户的语音),而其它声音源可提供不合需要的声音信号(例如,噪声、来自其它附近的人的语音,等等)。第一声学输入信号A602由第一麦克风606俘获为第一声音信号,且第二声学输入信号B 604由第二麦克风608俘获为第二声音信号。声学信号A 602和声学信号B 604可源自相同声音源,但可在到达其相应麦克风之前采用不同路径。因此,声学信号A 602可展现与声学信号B 604不同的特性。所俘获的声学信号A 602和B 604可接着由模/数转换器610和612数字化为相应第一和第二声音信号。额外声学信号603也可由一个或一个以上额外麦克风607俘获且由模/数转换器611数字化为额外声音信号以改善信号俘获。

第一信噪比计算器614可确定第一声音信号(例如,经数字化的输入信号A 602)的SNR。类似地,第二信噪比计算器616可确定第二声音信号(例如,经数字化的输入信号B 604)的SNR。SNR比较器618可接着比较所述信噪比(对应于第一和第二声音信号以及其它声音信号)且可通过控制切换器620来选择具有最好SNR值的声音信号。以此方式,可使具有最好SNR(亦即,最大)的信号作为声音输出信号622而通过。在一些配置中,在发射器626经由通信网络将输出声音信号622发射到既定收听者之前,信号处理器624可随后对输出声音信号622执行额外处理(例如,回音消除、噪声降低、自动增益控制(AGC)、编码,等等)。

如先前所指出,将一输入声音信号分段为连续样本群组(表示为帧)。每一帧可含有许多连续样本。接着,将连续帧分组为帧集合。对于所论述的实例和方程式来说,界定以下标记法:

N表示一帧中的样本的数目。

M表示一帧集合中的帧的数目。

Ψk(μ)表示由M个连续帧组成的第μ个帧集合。

Φk(μ,m)表示Ψk(μ)中的第m个帧。此处,m从0到M-1取值。帧集合Ψk(μ)中的帧为Φk(μ,0)到Φk(μ,M-1)。

sk(μ,m,n)表示Φk(μ,m)中的第n个样本。此处,n从0到N-1取值。

所有下标k均指代第k个麦克风。

图7是说明在移动装置上操作以基于信噪比监视来执行麦克风选择的方法的流程图。此方法可用以连续地或周期性地监视和更新两个或两个以上麦克风信号中的每一者的噪声底限。通过每一麦克风来俘获声音信号(例如,来自声学声音信号)且将所述声音信号分段为帧(702),其中帧中的每一者含有N个信号样本。作为一实例,可将数目N设定成在十(10)毫秒(ms)的周期期间收集的样本的数目。接着,可使用(例如)方程式1来计算或获得每一麦克风的每一信号帧的信号功率(例如,第k个麦克风的帧m的功率Pk(m))(704):

Pk(μM+m)=Σn=0N-1sk2((μM+m)N+n)n=0,…,N-1,m=1,…,M-1,μ∈Z(方程式1)

在方程式1中,下标k表示个别麦克风,n为表示第m个帧中的信号样本的整数,m表示帧集合内的帧,且μ表示特定麦克风信号的帧集合。接着,可使用(例如)方程式2对M个连续信号功率(例如,Pk(uM+m),m=0,...,M-1)中的最小信号功率(表示为噪声底限估计NFEk(u))执行搜索(706):

NFEk(u)=min{Pk(uM),...,Pk(uM+M-1)}u∈Z    (方程式2)

在方程式2中,u为表示含有M个连续帧的集合的周期的整数。所搜索的最小值NFEk(u)为(例如)含有M个连续帧的第u个周期的对应麦克风通道的噪声底限。注意,特定帧集合的噪声底限近似为所述帧集合的最小帧信号功率。因此,可通过采用多个连续帧的噪声底限中的最低者来获得噪声底限估计(也被称作最小信号功率)NFEk(u)(如在方程式2中)。

图8图解地说明用于麦克风信号内的最小信号功率的搜索过程的实例。在此实例中,可获得每一帧集合的最小信号功率NFEk(·)min。举例来说,获得第一帧集合Ψk(μ)的第一最小功率NFEk(μ)min,获得第二帧集合Ψk(μ+1)的第二最小功率NFEk(μ+1)min,获得第三帧集合Ψk(μ+2)的第三最小功率NFEk(μ+2)min,且获得第四帧集合Ψk(μ+3)的第四最小功率NFEk(μ+3)min

返回参看图7,为了避免噪声底限估计的显著变化,可(例如)使用方程式3使噪声底限平滑(708):

NFk(μ)=αNFk(μ-1)+(1-α)NFEk(μ)0<α<1    (方程式3)

可接着基于每一帧的信号功率和每一麦克风的噪声底限而获得所述麦克风的每一信号帧的信号SNR(710)。可(例如)使用方程式4来计算帧集合Ψk(μ)中的每一帧的SNR:

SNRk(uM+m)=Pk(uM+m)NFk(u)m=0,···,M-1uZ(方程式4)

对于当前帧集合NFk(μ)的噪声底限可能不立即可用的实时应用来说,可(例如)使用方程式5来计算信号SNR(基于先前帧集合NFk(μ-1)的噪声底限):

SNRk(uM+m)=Pk(uM+m)NFk(u-1)m=0,···,M-1uZ(方程式5)

通过(例如)使用方程式6来选择具有最好SNR的麦克风信号而获得输出信号sout(t)(712):

sout((uM+m)N+n)=s1((uM+m)N+n)SNR1(uM+m)>SNR2(uM+m)s2((uM+m)N+n)SNR1(uM+m)<SNR2(uM+m)(方程式6)

其中s1(t)和s2(t)是分别由第一麦克风和第二麦克风在时间t所俘获的信号。输出信号sout(t)是在选择过程之后的信号。注意,可逐帧地执行两个信号s1(t)与s2(t)之间的信号选择,以便可在每一帧时间周期内选择最好信号。

可在经由通信网络将输出信号sout(t)发射到既定收听者(716)之前对输出信号sout(t)执行额外信号处理(例如,回音消除、噪声降低、AGC、编码,等等)(714)。

为了避免在信号之间进行不必要的频繁切换,可使用最小改善阈值。举例来说,可根据方程式7来选择输出信号sout

(方程式7)

在方程式7中,sactive表示当前所使用(所选择)的麦克风信号,且sinactive表示当前未使用的麦克风信号。SNRinactive(uM+m)表示当前未使用的麦克风信号的信噪比SNR。在给定时间,非现用信噪比SNRinactive(uM+m)可为SNR1(uM+m)或SNR2(uM+m)。类似地,SNRactive(uM+m)表示使用中(当前所选择)的麦克风信号的SNR且在给定时间可为SNR1(uM+m)或SNR2(uM+m)。Q1(uM+m)为充当用于切换的滞后阈值的正实数。

滞后阈值Q1(uM+m)可为动态测量值,而非静态测量值。举例来说,如果当前使用来自第一麦克风A的第一信号(具有第一信号特性),则来自第二麦克风B的第二信号的第二信号特性可超过第一信号特性待使用的额外阈值Q1。如果第二信号特性(与第二麦克风B的第二信号相关联)未超过第一信号特性(与第一麦克风A的第一信号相关联)额外阈值Q1,则算法继续使用来自第一麦克风A的第一信号。另一方面,如果当前使用来自第二麦克风B的第二信号(具有第二信号特性),则在使用来自第一麦克风A的第一信号之前,第一麦克风A的第一信号的第一信号特性可超过第二信号特性额外阈值Q1。否则,算法继续使用来自第二麦克风B的第二信号。

图9是说明在移动装置上操作以基于信噪比监视而对从两个麦克风俘获的声音信号进行加权的方法的流程图。可从第一麦克风俘获第一声音信号(来自第一声学信号)(902),且可从第二麦克风俘获第二声音信号(来自第二声学信号)(904)。可确定第一声音信号的第一信噪比(906),且可确定第二声音信号的第二信噪比(908)。如果第一信噪比大于第二信噪比,则可对第一声音信号进行加权(例如,在零与一(包括零与一)之间进行缩放)以与第二声音信号相比提供对输出声音信号的更大作用(910)。如果第二信噪比大于第一信噪比,则也可对第二声音信号进行加权以与第一声音信号相比提供对输出声音信号的更大作用(912)。在经由通信网络将输出声音信号发射到既定收听者(916)之前,可随后对输出声音信号执行额外信号处理(914)。

在获得第一声音信号中的每一者的信噪比时,可将第一声音信号分段为多个连续帧。可将所述多个连续帧分组为多个连续帧集合。接着获得第一声音信号的多个连续帧的多个连续信号功率。在多个连续帧集合中的每一者中,可接着在第一声音信号的帧集合内部在连续信号功率中搜索最小信号功率以获得噪声底限估计,使用所述噪声底限估计将获得第一信噪比。可类似地处理第二声音信号以获得第二信噪比。可在第一与第二信噪比之间执行比较。可在逐帧的基础上或对多个连续帧的SNR进行此SNR比较。对于后者来说,可仅在满足许多连续帧的切换准则时才发生信号切换。

基于信号功率的麦克风选择

图10是说明可经配置以基于信号功率而在来自不同麦克风的两个输入声音信号之间进行选择以改善声音质量的移动装置的框图。在具有占优势的扩散噪声的环境中,SPL(声压级)可几乎到处均类似。当不存在所要话音时,移动装置的两个或两个以上麦克风处的SPL或信号功率将彼此类似。然而,如果存在待俘获的所要话音,则两个麦克风处的SPL或信号功率可依据发声参考点(MRP)或声音源的地点和移动装置的位置而不同。在此情况下,如果两个或两个以上麦克风具有相同灵敏度(亦即,其产生具有相同SPL(声压级)的相同信号电平),则可在不计算实际信号SNR的情况下进行将使用哪一麦克风信号的决定。

在此实例中,可通过第一麦克风1006而将第一声学输入信号A 1002俘获为第一声音信号,且可通过第二麦克风1008而将第二声学输入信号B 1004俘获为第二声音信号。声学信号A 1002和声学信号B 1004可源自相同声音源1001、1005和/或1009中的一者或一者以上,但可在到达其相应麦克风之前采用稍微不同的路径。可接着分别通过模/数转换器1010和1012来使第一声音信号(对于第一麦克风来说为1002)和第二声音信号(对于第二麦克风来说为B 1004)数字化。也可通过一个或一个以上额外麦克风1007而将额外声学信号1003俘获为声音信号,且通过模/数转换器1011使额外声学信号1003数字化以改善信号俘获。

第一信号功率计算器1014可确定经数字化的第一声音信号(对应于声学输入信号A1002)的信号功率。类似地,第二信号功率计算器1016可确定经数字化的第二声音信号(对应于声学输入信号B 1004)的信号功率。信号功率比较器1018可接着对所述信号功率(对应于第一和第二声音信号以及任何其它经数字化的声音信号)进行比较且通过控制切换器1020来选择具有最高信号功率的声音信号。以此方式,使具有最好信号功率(亦即,最大)的信号作为声音输出信号1022而通过以用于后续信号处理且经由通信网络发射到既定收听者。

在一些配置中,在发射器1030经由通信网络将声音输出信号1022发射到既定收听者之前,信号处理器1028可随后对声音输出信号1022执行额外处理(例如,回音消除、噪声降低、自动增益控制(AGC)、编码,等等)。

图11是说明在移动装置上操作以基于信号功率监视来执行麦克风选择的方法的流程图。尽管此实例使用两个麦克风,但可延伸相同方法以支持从额外麦克风的信号选择。如果尚未校准两个或两个以上麦克风,则可在进行切换决定之前对其进行校准以具有相同灵敏度(1102)。

可通过每一麦克风来俘获声音信号(来自声学信号)且将其分段为帧(1104),其中帧中的每一者含有N个信号样本。作为一实例,数目N可为在十(10)毫秒(ms)的周期期间所收集的样本的数目。接着,使用(例如)方程式8来计算或获得每一声音信号(包括当前所选择的第一麦克风声音信号)的每一信号帧的信号功率(例如,第k个麦克风声音信号的帧m的信号功率Pk(m))(1106):

(方程式8)

在方程式8中,Pinactive(m)是在信号帧m内不在使用(未选择)的麦克风的信号功率,且Pinactive(m)是在信号帧m内正在使用的麦克风(当前所选择的麦克风信号)的信号功率。Q2(m)是充当用于切换的滞后阈值的正实数。图11中的实例假定当前选择第一麦克风信号。对于对应信号帧来说,进行关于第二麦克风声音信号的第二信号功率是否超过第一麦克风声音信号的第一信号功率至少阈值量的决定(1108)。如果第二信号功率超过第一信号功率至少阈值量,则移动装置切换到将第二麦克风声音信号的帧用作输出信号(1010)。亦即,如果Pinactive(m)超过Pactive(m)最小容限Q2(m),则非现用麦克风声音信号变成现用麦克风声音信号,且现用麦克风声音信号变成非现用麦克风声音信号。否则,移动装置继续将第一麦克风声音信号的帧用作输出信号(1112)。可在经由通信网络将输出信号发射到既定收听者(1116)之前对输出信号执行额外信号处理(例如,回音消除、噪声降低、增益控制、编码,等等)(1114)。

图12是说明在移动装置上操作以基于信号功率来动态地调整信号权重的方法的流程图。可校准第一和第二麦克风以具有大体上相同的灵敏度(1200)。可通过第一麦克风来俘获第一声学信号以获得第一声音信号(1202)。类似地,可在第二麦克风上俘获第二声学信号以获得第二声音信号(1204)。可获得第一声音信号的第一信号功率,且可获得第二声音信号的第二信号功率(1206)。可接着将第一信号功率与第二信号功率彼此比较(1208)。如果第一信号功率大于第二信号功率,则可对第一声音信号进行加权(缩放)以与第二声音信号相比提供对输出声音信号的更大作用(1210)。如果第二信号功率大于第一信号功率,则可对第二声音信号进行加权以与第一声音信号相比提供对输出声音信号的更大作用(1212)。可在经由通信网络将输出声音信号发射到既定收听者(1216)之前对输出声音信号执行额外信号处理(1214)。

也可对从多个帧获得的结果进行信号选择程序。举例来说,在许多连续帧内非现用麦克风声音信号大于现用麦克风声音信号之后,现用麦克风声音信号与非现用麦克风声音信号切换。

信号之间的切换转变

存在多种从使用一个麦克风信号转变为使用另一麦克风的方式。最简单方式可为进行硬切换,其中如先前部分中所说明,移动语音移动装置在一例子处开始使用另一麦克风声音信号且停止当前麦克风声音信号。通常,此硬转变将因信号不连续性而导致恼人的假象。

为了避免所述假象,可使转变更平滑。举例来说,可利用一用于切换的转变时间周期。在转变周期期间,来自先前非现用的麦克风的信号的部分增加,而来自先前使用的麦克风的信号的部分减小,直到切换完成。举例来说,再次参看图10,可使用第一定相函数f(t)1024来逐步采用(phase in)非现用信号,且可使用第二定相函数g(t)1026来逐步停用(phase out)现用信号。通常,在转变周期期间获得输出信号时,可将第一声音信号(来自第一麦克风)与第二声音信号(来自第二麦克风)掺合,使得第一声音信号的作用逐渐地减小,且第二声音信号的作用逐渐地增加。

图13(斜坡函数)和图14(上升余弦函数)中给出平滑曲线定相的两个实例。在这些实例中,切换转变周期花费T秒。在转变周期期间,使用(例如)方程式9来确定输出信号s(t):

s(t)=sinactive(t)f(t)+sactive(t)g(t)    (方程式9)

在方程式9中,f(t)是逐步采用函数(phasing in function),且g(t)是逐步停用函数(phasing out function)。在转变周期期间,方程式10的相等性成立:

f(t)+g(t)=c,    (方程式10)

其中c为常数。在图13和图14中,将f(t)+g(t)设定为等于一(1)。在转变周期之后,最初非现用的麦克风信号变为现用麦克风信号,且最初现用的麦克风信号变为非现用麦克风信号。图13说明线性转变周期,而图14说明非线性转变周期。

尽管本文中所描述的各种实例使用两个麦克风,但可将本文中所描述的特征一般化为多个额外麦克风。举例来说,可在声音俘获系统中使用K个麦克风。可将输出信号选择为具有最好SNR的输入信号。举例来说,可将其公式化为:

s((uM+m)N+n)=si((uM+m)N+n)i=argmaxkSNRk(uM+m)n=0,···,N-1,(方程式11)

其中SNRk(uM+m)是第k个麦克风在帧Φk(μM+m)的SNR。在方程式11中,arg max函数产生具有最大SNR的麦克风的指数。

基于经加权的麦克风信号的输出信号

可延伸图10、图13和图14所说明的两个或两个以上输入声音信号之间的转变以提供经加权的输出声音信号。

图15是说明移动装置可如何对来自不同麦克风的多个输入声音信号进行加权以提供输出声音信号的框图。在此实例中,通过第一麦克风1506将声学输入信号A 1502俘获为第一声音信号,且通过第二麦克风1508将声学输入信号B 1504俘获为第二声音信号。声学信号A 1502和声学信号B 1504可源自相同声音源1501、1505和/或1509,但可在到达其相应麦克风之前采用不同路径。可接着通过模/数转换器1510和1512使第一和第二声音信号(从声学信号A 1502和B 1504获得)数字化。也可通过一个或一个以上额外麦克风1507将额外声学信号1503俘获为额外声音信号,额外声音信号可接着由模/数转换器1511数字化以改善信号俘获。

经数字化的声音信号可接着根据一个或一个以上因素或信号特性(例如,其对应或相对的信噪比、信号功率,等等)通过权重1514、1515和1516来加权。每一声音信号的权重1514、1515和1516可为时变加权函数,其用以执行信号选择,使得所有权重的和在任一时间均为恒定值c。在一个实例中,权重1514、1515和1516可从零(0)变化到一(1),使得其总和为一(1)。可接着将经加权的信号一起组合或相加为输出声音信号1520。在发射器1524可经由通信网络将输出信号1520发射到既定收听者之前,信号处理器1522可随后对输出信号1520执行额外处理(例如,回音消除、噪声降低、自动增益控制(AGC)、编码,等等)。

图16是说明在移动装置上操作以执行两个或两个以上麦克风的信号加权的方法的流程图。此方法说明对来自两个麦克风的两个声音信号进行加权的过程,但可延伸相同方法以对来自额外麦克风的信号进行加权。可从移动装置上的三个或三个以上麦克风选择多个麦克风(1602)。可从每一所选择的麦克风获得声音信号(例如,来自在每一麦克风处所俘获的声学信号)且将其分段为帧(1604)。获得每一麦克风声音信号的每一帧的信号特性(例如,信号功率、信噪比,等等)(1606)。使用每一麦克风声音信号的每一帧的信号特性来确定每一麦克风声音信号的权重(1608)。举例来说,特定麦克风声音信号的权重可通过对其帧的第一特性(例如,信号功率、信噪比,等等)和对应于一个或一个以上其它麦克风声音信号的帧的第二特性(例如,信号功率、信噪比,等等)进行比较而获得。可根据每一麦克风声音信号的对应权重而对其进行加权(或缩放)(1610)。以更一般化的形式,移动装置可使用来自两个麦克风的信号的组合,如下:

sout(t)=w1(t)s1(t)+w2(t)s2(t)    (方程式12)

其中,w1(t)和w2(t)是用以执行信号组合的时变加权函数。在任何时间t,方程式12的相等性均成立:

w1(t)+w2(t)=c    (方程式13)

其中c为常数。如果s1(t)具有更高SNR,则将w1(t)设定为接近于c且将w2(t)设定为接近于零(0),且反之亦然。

在方程式12中,可(例如)通过两个麦克风信号的信号SNR来确定经加权的函数w1(t)和w2(t)。举例来说,如果SNR1(uM+m)大于SNR2(uM+m),则将w1((uM+m)N+n)设定为接近于c,而将w2((uM+m)N+n)设定为接近于零(0)。如果SNR1(uM+m)小于SNR2(uM+m),则将w1((uM+m)N+n)设定为接近于零(0),而将w2((uM+m)N+n)设定为接近于c。在转变周期中,w1(t)与w2(t)之间的关系类似于图10、图13和图14所说明的f(t)与g(t)之间的关系。

可接着组合经加权的声音信号以获得输出声音信号(1612)。在经由通信网络将输出信号发射到既定收听者(1616)之前,可任选地对输出声音信号执行额外信号处理(例如,回音消除、噪声降低、增益控制、编码,等等)(1614)。

以更一般化的形式,可将输出信号sout表达为多个麦克风信号的组合,例如:

sout((uM+m)N+n)=Σk=1Kwk((uM+m)N+n)sk((uM+m)N+n)(方程式14)

其中c为常数,且wk为特定信号帧sk的加权函数。

根据又一配置,移动装置中的电路可经配置以或适于从第一麦克风获得第一声音信号。相同电路、不同电路或相同或不同电路的第二部分可经配置以或适于从第二麦克风获得第二声音信号,其中第一和第二声音信号中的每一者包括来自第一声音源的第一源信号的至少一部分。另外,相同电路、不同电路或相同或不同电路的第三部分可经配置以或适于获得第一声音信号的第一信号特性。类似地,相同电路、不同电路或第四部分可经配置以或适于获得第二声音信号的第二信号特性,其中第一和第二信号特性两者均与相同信号特性相关联。电路的经配置以或适于获得第一和第二声音信号的部分可直接或间接耦合到电路的获得信号特性的部分,或其可为相同电路。相同或不同电路的第四部分可经配置以或适于基于信号特性而对第一和第二声音信号进行加权。相同或不同电路的第五部分可经配置以或适于组合经加权的第一和第二声音信号以获得输出声音信号。第五部分可有利地耦合到第四部分,或其可实施在与第四部分相同的电路中。所属领域的技术人员将认识到,通常,可以类似方式来实施本发明中所描述的大多数处理。电路或电路部分中的任一者可单独实施或作为集成电路的一部分与一个或一个以上处理器组合实施。电路中的一者或一者以上可在集成也路、高级RISC机器(ARM)处理器、数字信号处理器(DSP)、通用处理器等等上实施。

图1、2、3、4、5、6、7、8、9、10、11、12、13、14、15和/或16中说明的组件、步骤和/或功能中的一者或一者以上可重新布置和/或组合为单个组件、步骤或功能,或者在若干组件、步骤或功能中实施。也可添加额外的元件、组件、步骤和/或功能。在图1、2、3、6、8、10、13、14和/或15中说明的设备、装置和/或组件可经配置以或适于执行图4、5、7、9、11、12和/或16中描述的方法、特征或步骤中的一者或一者以上。本文描述的算法可有效地以软件和/或嵌入硬件来实施。

所属领域的技术人员将进一步了解,结合本文所揭示的配置而描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、计算机软件或上述两者的组合。为了清楚地说明硬件与软件的这种可互换性,上文大体上根据各种说明性组件、块、模块、电路和步骤的功能性来描述所述各种说明性组件、块、模块、电路和步骤。将此功能性实施为硬件还是软件取决于特定应用和强加于整个系统的设计限制。

本文描述的各种特征可在不同系统中实施。举例来说,信号选择和/或组合模块320(图3)可在单个电路或模块中、在单独的电路或模块上实施、由一个或一个以上处理器执行、由并入机器可读或计算机可读媒体中的计算机可读指令执行和/或在手持式装置、移动计算机和/或移动电话中实施。

应注意,上述配置仅是实例且不应解释为限制权利要求书。对配置的描述既定为说明性的,且不限制权利要求书的范围。由此,本发明的教示可容易应用于其它类型的设备,且所属领域的技术人员将明了许多替代、修改和变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号