首页> 中国专利> 已分辨和未分辨谐波的统一处理

已分辨和未分辨谐波的统一处理

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种针对由一个滤波带中的两个谐波的干涉而产生的调制包络(7)的后处理方法，该方法包括以下步骤：通过带通滤波器组(6)对包络进行滤波，其中，对调制包络(7)进行解调与应用带通滤波器(6)的组合使得可以对已分辨和未分辨谐波使用相同的算法。

著录项

公开/公告号CN1707609A

专利类型发明专利
公开/公告日2005-12-14

原文格式PDF
申请/专利权人本田研究所欧洲有限公司;
展开▼

申请/专利号CN200510077848.5
发明设计人弗兰克·茹布兰;马丁·黑克曼;
展开▼

申请日2005-06-03
分类号G10L15/00;G10L15/20;G10L21/02;
代理机构北京三友知识产权代理有限公司;
代理人李辉
地址德国美因河畔奥芬巴赫
入库时间 2023-12-17 16:46:38

法律信息

法律状态公告日

法律状态信息

法律状态
2013-07-24

未缴年费专利权终止 IPC(主分类):G10L15/00 授权公告日:20120201 终止日期:20120603 申请日:20050603

专利权的终止
2012-02-01

授权

授权
2007-07-11

实质审查的生效

实质审查的生效
2005-12-14

公开

公开

说明书

技术领域

本发明涉及根据单声道录音中的多个声源的基频对这些声源进行分离的方法。具体来说，提出了使得可以采用同一算法对已分辨和未分辨的谐波进行处理并且随后对结果进行组合的方法。

背景技术

当进行录音时，通常同时存在多个声源。这些声源可以是不同的语音信号、噪声(例如爱好者的)或类似信号。为了进一步对这些信号进行分析，首先必须分离这些相互干涉的信号。通常采用语音识别或声音场景分析。公知的是，在人类的听觉系统中可以根据谐波信号的基频分离这些谐波信号(例如，参见A.Bregman.Auditory Scene Analysis.MITPress，1980)。此处值得注意的是，通常语音包含许多话音段，因此包含很多谐波段。

在常规方法中，通过带通滤波器将输入信号分成多个不同频带，并且在稍后的对于各频带的阶段中，在各时刻计算表明该频带源自给定基频的证据值(evidence value)(也可以使用二元证据值来解释简单的一元判定)。这样，可以通过以下的轴获得信号的三维描述：基频、频带以及时间。在人类的听觉系统中也找到了这种表示(例如，参见G.Langner，H.Schulze，M.Sams，and P.Heil.The topographic representation of periodicitypitch in the auditory cortex.Proc.Of the NATO Adv.Study Inst.On Comp.Hearing，pages 91--97，1998)。

根据这些预先计算出的证据值，可以形成具有共同基频的频带组。因此在各组中只存在源自一个基频的多个谐波，因而这些谐波属于一个声源。以此方式，可以实现多个声源的分离。

如果所考查的谐波的频率与抽样频率相比较高，则尤其难以对表明谐波源自给定基频的证据值进行计算。如果按以下方式选择用于对信号进行分析的带通滤波器的带宽：对于高频，两个或更多个谐波落入一个频带中，则该滤波器频带显示出利用这些谐波的基频的一半进行的调幅。该效果也称为未分辨谐波(例如，参见H.Helmholtz.Die Lehre von denTonempfindungen.Vieweg，Braunschweig，1863)。进而，在解调之后对调制包络的估计便于计算高频的前述证据值。

对于低频，将滤波器带宽设计为足以包含至少两个谐波则较为不可行，这是因为所得宽带宽与中心频率有关。因此，对于低频，必须选择与用于高频的过程不同的过程。因此产生了如何组合这两个过程的结果的问题。

图1示出了一种解决所述问题的公知方法。通过考虑阈频率fT将低频过程和高频过程应用于所述多个频带。该方法实际上包括如下步骤，即，从针对小于给定频率fT的所有频带的一个过程4中选择结果以及从针对所有其余频带的另一过程5中取出结果(例如，参见G.Hu and D.Wang.Monaural speech segregation based on pitch tracking and amplitude.IEEE Trans.On Neural Networks，2004)。

发明内容

鉴于上述情况，本发明的一个目的是提供一种用于分离输入信号中的信号源(如声音)的更高效方法。

另一目的是提出一种将同一证据值计算过程应用于已分辨和未分辨谐波的方法，其中，该证据值反映了谐波源自给定基频这一事实。

本发明的基本思想是将带通滤波器组应用于调制包络，以得到有关调制包络的谐波的信息。

根据本发明的第一方面，提出了一种对于由一个滤波带中的两个谐波的干涉产生的调制包络的后处理方法。该方法基于利用带通滤波器组对调制包络进行的滤波，其中，对调制包络进行解调以及应用带通滤波器的组合使得可以对已分辨和未分辨的谐波使用相同的算法。

根据本发明的另一方面，提出了一种估计给定频带是否显示出调幅的方法。该方法包括这样的步骤，即，计算给定频带是否足够宽，以至于包含给定基频的两个谐波。

根据本发明的另一方面，提出了一种对表明频带源自某个基频的证据值进行组合的方法，其中，依据所述估计的结果，在合成过程中，根据作用于低频或高频(分别为已分辨和未分辨谐波)中任何一个的过程来获得给定基频、给定频带以及给定时刻的证据值。

根据本发明，还提供了一种计算机程序产品，其适于当在计算装置上运行时实施上述方法。

最后，本发明旨在使用上述多个方法，以基于单声道录音中的声源的基频来分离这些声源。

附图说明

根据所附权利要求和以下结合附图的详细说明，本领域的技术人员将清楚本发明的其它优点和可能应用。图中：

图1示出了将不同的证据值计算过程应用于低频带和高频带的公知方法；

图2示出了根据本发明一实施例的将同一证据值计算过程应用于低频带和高频带的方法；

图3示出了本发明的另一实施例，其中，选择显示出调幅的频带；以及

图4示出了根据本发明的用于分离单声道录音中的声源的装置的框图。

具体实施方式

根据第一实施例，由于本发明将带通滤波器组应用于调制包络，所以扩展了公知的谐波信号分离方法。这样，可以显著减少在包络中存在的失真和噪声。

当使用非相干振幅解调时，调制包络还包括与原始输入信号的基频相同的基频，以及多个谐波(非相干解调使得包络的频率加倍)。

图2示出了如何利用根据本发明的已滤波调制包络来处理输入声音信号，以分离谐波信号并且进而分离声源。

在利用带通滤波器组2将输入信号1带通滤波为n个频带f1、……、fn之后，将这些频带分离3成两类：低频带12和高频带11。低频带12包含已分辨谐波，而高频带11包含未分辨谐波。

通过适合于低频带的特定证据值计算过程对低频带12进行处理，如公知的基于自相关的方法、交叉信道相关方法或基于调和性的方法。

对于高频带11的证据值计算，本发明利用了以下事实：对未分辨谐波的滤波器响应进行了调幅，并且该响应包络在所考虑声源的基频处波动。

由此对各高频带11进行解调6，以获得频带11的调制包络7。将调制包络7传给带通滤波器组8，该带通滤波器组8输出频带f₁′到f_m′。在将带通滤波器组8应用于所述调制包络7之后，至此可以对获得的频带f₁′到f_m′应用与用于低频带12的证据值计算过程相同的证据值计算过程10(例如，基于自相关的方法)。

在另一实施例中，分别用于输入信号1的原始分解以及包络7的滤波8的带通滤波器组2、8是相同的。

通过考虑包含在调制包络7的谐波中的信息，以上提出的方法尤其增加了该过程的健壮性。

图3示出了如何将频带f₁到f_n分离成分别包含已分辨和未分辨谐波的低频和高频这两组。

针对各基频，假设已知第一分解滤波器组2的带宽，计算出包含所考虑基频的至少两个谐波的频带。通过该方法，可以确定哪些频带显示出调幅，而在合成过程中，只有这些频带的证据值将从作用于高频的过程6、8、10中得到，而其余证据值是从作用于低频的过程4中确定的。

考虑到基频f_F和带宽为Δf_i的频带f_i，如果满足下式，则该频带包含基频的至少两个谐波：

n-m≥1 (式1)

其中m和n为由下式定义的整数：

$>>m>->1><>>>>f>i>>->>>Δ>>f>i>>>2>>>>f>F>>>≤>m>>>(式2)$

$>>n>≤>>>>f>i>>+>>>Δ>>f>i>>>2>>>>f>F>>>≤>n>+>1>>>(式3)$

图3的示例15示出了上述参数，其中所示频带实际上包含第二和第三谐波。

由于实自变量(argument)x的整数部分[x]是由下式定义的：

[x]是一整数，且

[x]≤x＜[x]+1 (式4)

所以整数n是实值 $>>>>f>i>>+>>>Δ>>f>i>>>2>>>>f>F>>>>的整数部分。$

根据式2和4还可以推导出整数m为实值 $>>->>>>f>i>>->>>Δ>>f>i>>>2>>>>f>F>>>>>的整数部分的相反数。$

由此，对于基频f_F，如果下式成立，则频带f_i包含基频f_F的至少两个谐波：

$>>[>>>>f>i>>+>>>Δ>>f>i>>>2>>>>f>F>>>]>+>[>->>>>f>i>>->>>Δ>>f>i>>>>2>>>>f>F>>>]>≥>1>>>(式5)$

通过对于各频带验证是否满足式5，可以选择14出包含给定基频的至少两个谐波的频带。

因此，一方面，所有不满足式5的频带都显示出已分辨谐波，并通过用于低频的过程4来处理。另一方面，满足式5的频带包含未分辨谐波，并由本发明的上述过程来处理，上述过程包括：解调6包络7，将包络带通滤波8成频带f₁′到f_m′，并将用于低频的所述过程应用10于频带f₁′到f_m′。

图4示出了根据本发明的用于分离单声道录音中的声源的装置的框图。

由麦克风21记录声音信号，并且该声音信号经由前置放大器22进行传递。然后带通滤波器组23产生n个不同的连续频带f₁到f_n。然后分离单元24负责将已分辨谐波12和未分辨谐波11分离成两个不同的组。

由自相关器25处理第一组12已分辨谐波(即，各低频带)，以对该源自给定基频的频带计算证据值。自相关器25可以与能够处理低频的任何其它单元互换。将自相关器25的结果馈送到频率组合单元31。

首先由整流单元26处理第二组11未分辨谐波(即，各高频带)，然后由低通滤波器27进行处理以产生所述频带11的调制包络7。由带通滤波器组28(其可以与带通滤波器组23相同)对包络7进行滤波。由此将包络7分割成频带f₁′到f_m′，并将各频带f₁′到f_m′馈送到自相关器29。然后将m个自相关器29的结果输入到最大检测器30，将最大检测器30的结果馈送给频率组合单元31。

装置20的最后一个单元是具有n个输入和1个输出的频率组合单元31。各个输入都是通过已分辨谐波块25或未分辨谐波块26-30的输出来馈送的，其中各块分别处理低频带12或高频带11。另选地，频率组合单元31只有两个输入：第一个输入，用于顺序地馈送所有低频带的处理结果，以及第二个输入，用于顺序地馈送所有高频带的处理结果。将装置20和频率组合单元31的输出传给负责有效声源分离的装置。

图2和图4例示了以下事实：根据本发明，负责证据值计算的过程4、10以及单元25、29对于已分辨和未分辨谐波来说是等同的。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 已分辨和未分辨谐波的统一处理 [P] . 中国专利： CN1707609B . 2012.02.01
2. 已分辨和未分辨谐波的统一处理 [P] . 中国专利： CN1707609A . 2005-12-14
3. Uniform treatment of dissolved and not - resolved harmonics [P] . 德国专利： DE602004007249T2 . 2008-02-28

机译：统一处理已溶解和未溶解的谐波
4. High resolution and high value video transfer method using pseudo natural image, high resolution and high value added video processing unit, high resolution and high value added video processing system, high resolution and high value added video transfer system and storage medium [P] . 日本专利： JPWO99/40725A1 . 2000-10-31

机译：使用伪自然图像的高分辨率和高价值视频传输方法，高分辨率和高附加值视频处理单元，高分辨率和高附加值视频处理系统，高分辨率和高附加值视频传输系统及存储介质
5. HIGH-RESOLUTION HIGH-VALUE-ADDED VIDEO TRANSFER METHOD BY USING PSEUDO NATURAL IMAGE, HIGH-RESOLUTION HIGH-VALUE-ADDED VIDEO PROCESSOR, HIGH-RESOLUTION HIGH-VALUE-ADDED VIDEO PROCESSING METHOD, HIGH-RESOLUTION HIGH-VALUE-ADDED TRANSFER SYSTEM, AND STORAGE MEDIUM [P] . 世界知识产权组织专利： WO9940725A1 . 1999-08-12

机译：利用伪自然图像的高分辨率高增值视频传输方法，高分辨率高增值视频处理器，高分辨率高增值视频处理方法，高分辨率高增值视频传输系统和存储介质