法律状态公告日
法律状态信息
法律状态
2016-10-26
授权
授权
2016-04-13
实质审查的生效 IPC(主分类):G10L19/00 申请日:20151027
实质审查的生效
2016-03-16
公开
公开
技术领域:
本发明属于信号处理与通信技术领域,具体涉及一种Odd-DFT域的正弦信 号参数估计方法,其用于基于Odd-DFT分析和基于MDCT分析的处理与应用系 统,尤其是音频信号处理与编解码系统。
背景技术:
参数估计是一个基本的信号处理问题,广泛应用于诸如信号通讯、仪器仪 表、医疗诊断和音频处理等领域。虽然现在已经有很多种低复杂度的参数估计 方法[1]-[5],但是它们中的绝大多数并不适用于基于MDCT分析的音频信号处 理系统。这是因为这些参数估计算法所使用的信号分析过程,如线性预测分析、 子空间分解、以及离散傅立叶变换(DFT)等,与音频信号处理系统中所使用的 MDCT分析不同。这样的信号分析过程需要额外的系统开销,使得整个系统的 复杂度增加。
为了解决上述问题,近十年以来,出现了两类适用于音频信号处理系统的 低复杂度正弦信号参数估计算法。
一类算法直接使用音频系统中的MDCT系数进行参数估计[6],这样的方法 避免了额外的信号分析过程,而估计算法本身的复杂度也不高,这样就能以非 常低的系统开销获得所需的参数估计值。但是由于MDCT系数会受到信号相位 的调制,尤其是在有噪条件下,这种由相位带来的调制直接影响到估计算法的 精度,使得这类使用MDCT系数进行频率估计的算法精度有限。尽管近年来出 现了一些MDCT域参数估计的改进算法[7]-[9],但是这些方法都无法避免相位 的影响。分析表明[10],这些MDCT域的算法在有噪条件下的均方误差(MSE) 性能类似,基本都离参数估计的理论下界——克拉美罗界(CRB)有点远,大 约10dB以上。
另一类算法借助于Odd-DFT分析来实现面向音频处理系统的低复杂度参数 估计[11],[12]。利用Odd-DFT系数与MDCT系数之间易于转换的特性,一方面 在Odd-DFT域进行参数估计,能够有效地避免相位的影响;另一方面通过简单 计算就能将Odd-DFT系数转换成MDCT系数,满足整个音频系统关于复杂度的 要求。但是现有的Odd-DFT域的参数估计方法是以近似拟合函数为基础的,这 种拟合函数的精度有限,使得算法的估计精度不高,甚至还不如MDCT域的方 法。
参考文献:
[1]H.So,K.W.Chan,Y.Chan,andK.Ho,“Linearpredictionapproachfor efficientfrequencyestimationofmultiplerealsinusoids:algorithmsandanalyses,” IEEETrans.SignalProcess.,vol.53,no.7,pp.2290–2305,July2005.
[2]H.C.So,F.Chan,andW.Sun,“Subspaceapproachforfastandaccurate single-tonefrequencyestimation,”IEEETrans.SignalProcess.,vol.59,no.2,pp. 827–831,Feb2011.
[3]B.Quinn,“EstimatingfrequencybyinterpolationusingFourier coefficients,”IEEETrans.SignalProcess.,vol.42,no.5,pp.1264–1268,May1994.
[4]E.JacobsenandP.Kootsookos,“Fast,accuratefrequencyestimators[DSP tipstricks],”IEEESignalProcess.Mag.,vol.24,no.3,pp.123–125,May2007.
[5]C.Candan,“Analysisandfurtherimprovementoffineresolutionfrequency estimationmethodfromthreeDFTsamples,”IEEESignalProcess.Lett.,vol.20,no. 9,pp.913–916,Sept2013.
[6]S.MerdjaniandL.Daudet,“Directestimationoffrequencyfrom MDCT-encodedfiles,”inProc.6thInt.Conf.DigitalAudioEffects(DAFx-03)Conf. Citeseer,Sep.2003,pp.1–4.
[7]M.Zhu,W.Zheng,D.Li,andM.Zhang,“Anaccuratelowcomplexity algorithmforfrequencyestimationinMDCTdomain,”IEEETrans.Consum. Electron.,vol.54,no.3,pp.1022–1028,2008.
[8]S.Zhang,W.Dou,andH.Yang,“MDCTsinusoidalanalysisforaudio signalsanalysisandprocessing,”IEEETrans.Acoust.,Speech,LanguageProcess., vol.21,no.7,pp.1403–1414,July2013.
[9]Y.DunandG.Liu,“AnimprovedMDCTdomainfrequencyestimation method,”inProc.IEEEInt.Conf.SignalandInformationProcess.(ChinaSIP2014), July2014,pp.120–123.
[10]Y.DunandG.Liu,“FrequencyestimationperformanceofseveralMDCT domainalgorithms,”inProc.Int.Conf.InternetMultimediaComputingandService. ACM,2014,pp.399–402.
[11]A.Ferreira,“AccurateestimationintheODFTdomainofthefrequency, phaseandmagnitudeofstationarysinusoids,”in2001IEEEworkshopon ApplicationsofSignalProcess.toAudioandAcoustics.IEEE,2001,pp.47–50.
[12]A.FerreiraandD.Sinha,“Accurateandrobustfrequencyestimationinthe ODFTdomain,”in2005IEEEworkshoponApplicationsofSignalProcess.toAudio andAcoustics,Oct2005,pp.203–206.
发明内容:
本发明的目的在于针对现有技术的不足,提供了一种在Odd-DFT域对含噪 正弦信号进行参数估计的方法。该方法仅使用几个Odd-DFT系数即可实现信号 频率、幅度和相位的高精度估计,具有较低的算法复杂度;同时由于从Odd-DFT 系数到MDCT系数的转换复杂度很低,该方法的系统复杂度也较低。所提出的 方法支持音频处理系统中最广泛使用的正弦窗条件,可用于单频正弦信号和频 域可分离的多频正弦信号在有噪条件下的参数估计。
为达到上述目的,本发明采用如下技术方案来实现的:
一种在Odd-DFT域对含噪正弦信号进行参数估计的方法,包括以下步骤:
1)获取含噪正弦信号一个分析帧的Odd-DFT变换系数,记做XO(k),其中, k=0,1,…,N为子带索引,N为变换的子带数;
2)查找所述一个分析帧的Odd-DFT变换系数XO(k)幅度的极大值及其所在 的子带位置,分别记做|XO(pi)|和pi,得到有效的正弦信号分量的频率粗估计值 其中i=1,…,l,l为检测到的极大值的个数;
3)根据与所述极大值|XO(pi)|相邻的系数值XO(pi-1)和XO(pi+1),使用 决策算法得到分支决策参数λi;
4)使用所述得到的分支决策参数λi,按照对应的频率修正算法,计算每一 个极大值所对应正弦频率分量的频率修正参数得到频率的精估计值
5)根据所述得到的频率值按照幅度与相位估计方法,得到每一个极大 值所对应正弦频率分量的幅度值和相位值
本发明进一步的改进在于,步骤1)中,具体步骤如下:
101)给定采样频率为fs的时域含噪正弦信号样本x(n),取连续2N个点作 为一帧信号;
102)对所述一帧信号加窗,窗函数为h(n),得到加窗的时域样本x(n)h(n);
103)对所述加窗的时域样本x(n)h(n),计算其Odd-DFT系数XO(k),得到 含噪正弦信号一个分析帧的Odd-DFT变换系数。
本发明进一步的改进在于,步骤101)中,所述给定采样频率为fs的时域含 噪正弦信号样本x(n)是实信号,考虑实信号的Odd-DFT系数具有对称性,一帧 信号取2N个样本点,Odd-DFT变换的子带数取前N个。
本发明进一步的改进在于,步骤102)中,窗信号h(n)为正弦窗,其表达式 如下:
本发明进一步的改进在于,步骤103)中,计算所述加窗的时域样本x(n)h(n) 的Odd-DFT系数XO(k),其计算公式如下:
本发明进一步的改进在于,步骤2)中,具体步骤如下:
201)设定正弦分量检测门限Xth,对所述一个分析帧的Odd-DFT变换系数 XO(k)幅度值进行预处理,预处理的结果为Xout(k),其计算公式如下:
202)检测所述Xout(k)的极大值及其所在的子带位置,得到有效的XO(k)幅 度极大值及其所在的子带位置,分别记做|XO(pi)|和pi,则每一个pi位置处对 应着一个有效的正弦信号分量;
203)根据所述有效的XO(k)幅度极大值所在的子带位置pi,得到有效的正 弦信号分量的频率粗估计值其计算公式如下:
本发明进一步的改进在于,步骤3)中,具体步骤如下:
301)对所述每一个pi位置所对应的有效的正弦频率分量,计算其邻频系数 比αi,其计算公式如下:
302)设定切换范围参数γ,且0≤γ<1,计算左切换阈值αL和右切换阈值αR, 其计算公式如下:
得到相应的αL和αR的值,当0≤γ<1时,αL≥αR,当γ=0时取等号;
303)根据所述计算得到的邻频系数比αi、左切换阈值αL和右切换阈值αR, 得到分支决策参数λi,其决策算法如下:
本发明进一步的改进在于,步骤4)中,具体步骤如下:
401)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述得到的 分支决策参数λi,计算频率修正参数
402)根据所述得到的频率修正参数和所述频率的粗估计值计算频率 的精估计值其计算公式如下:
本发明进一步的改进在于,步骤401)中,计算频率修正参数的方法如下:
当λi=1时,
当λi=2时,
当λi=3时,
本发明进一步的改进在于,步骤5)中,具体步骤如下:
501)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述极大值 所在位置pi及其对应的所述频率精估计值得到幅度的估计值其计算公 式如下:
502)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述极大值 所在位置pi及其对应的所述频率精估计值得到相位的估计值其计算公式 如下:
与现有的正弦信号参数估计方法相比,本发明具有以下有益效果:
1、与经典的正弦参数估计方法相比,本发明公开的方法能有效地与高品质 语音音频处理系统所采用的MDCT变换框架结合起来,通过时域信号 →Odd-DFT变换→MDCT变换的方式,仅需要很小的系统开销;
2、与目前已有的MDCT域正弦参数估计方法相比,本发明公开的方法能够 克服在MDCT域进行参数估计时相位信息的影响,从而大大地提高了估计结果 的精度和稳定度;
3、与目前已有的Odd-DFT域正弦参数估计方法相比,本发明公开的方法 建立在更精确的正弦信号Odd-DFT分析的基础上,得到的估计结果接近克拉美 罗界,极大地提高了参数估计的精度。
附图说明:
图1为Odd-DFT域正弦信号参数估计流程示意图;
图2为使用Odd-DFT分析的音频信号处理系统框图;
图3为不同频率下的频率估计误差性能对比图;
图4为不同信噪比条件下的频率估计误差性能对比图;
图5为幅度与相位估计的性能对比图。
具体实施方式:
下面结合附图和具体实施例对本发明做进一步详细说明,所述是对本发明 的解释而不是限定。
实施例一:Odd-DFT域正弦信号参数估计方法——普通模式
如图1所示系统的整体流程,普通模式的Odd-DFT域正弦信号参数估计方 法中,切换范围参数γ=0.2,此模式的估计算法包括以下步骤:
1)获取正弦信号一个分析帧的Odd-DFT变换系数,记做XO(k),其中, k=0,1,…,N为子带索引,N为变换的子带数。具体步骤如下:
101)给定采样频率为fs的时域含噪正弦信号样本x(n),考虑到x(n)是实信 号,其Odd-DFT系数具有对称性,取连续2N个点作为一帧信号,Odd-DFT变 换的子带数取前N个;
102)对所述一帧信号加窗,窗函数h(n)为正弦窗,其表达式如下:
得到加窗的时域样本x(n)h(n);
103)对所述加窗的时域样本x(n)h(n),计算其Odd-DFT系数XO(k),计算 公式如下:
2)查找所述一个分析帧的Odd-DFT变换系数XO(k)幅度的极大值及其所在 的子带位置,分别记做|XO(pi)|和pi,得到频率的粗估计值其中,i=1,…,l, l为检测到的极大值的个数。具体步骤如下:
201)设定正弦分量检测门限Xth,对所述一个分析帧的Odd-DFT变换系数 XO(k)幅度值进行预处理,预处理的结果为Xout(k),其计算公式如下:
202)检测所述Xout(k)的极大值及其所在的子带位置,得到有效的XO(k)幅 度极大值及其所在的子带位置,分别记做|XO(pi)|和pi,其中i=1,…,l,l为检测 到的极大值的个数,则每一个pi位置处对应着一个有效的正弦信号分量。
203)根据所述有效的XO(k)幅度极大值所在的子带位置pi,得到所述有效 的正弦信号分量的频率粗估计值其计算公式如下:
3)根据与所述极大值|XO(pi)|相邻的系数值XO(pi-1)和XO(pi+1),使用 决策算法得到分支决策参数λi。具体步骤如下:
301)对所述每一个pi位置所对应的有效的正弦频率分量,计算其邻频系数 比αi,其计算公式如下:
302)设定切换范围参数γ=0.2,计算左切换阈值αL和右切换阈值αR,其 计算公式如下:
得到相应的αL和αR的值。
303)根据所述计算得到的邻频系数比αi、左切换阈值αL和右切换阈值αR, 得到分支决策参数λi,其决策算法如下:
4)使用所述得到的分支决策参数λi,按照对应的频率修正算法,计算每一 个极大值所对应正弦频率分量的频率修正参数得到频率的精估计值具体 步骤如下:
401)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述得到的 分支决策参数λi,计算频率修正参数其计算方法如下:
当λi=1时,
当λi=2时,
当λi=3时,
402)根据所述得到的频率修正参数和所述频率的粗估计值计算频率 的精估计值其计算公式如下:
5)根据所述得到的频率值按照幅度与相位估计方法,得到每一个极大 值所对应正弦频率分量的幅度值和相位值具体步骤如下:
501)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述极大值 所在位置pi及其对应的所述频率精估计值得到幅度的估计值其计算公 式如下:
502)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述极大值 所在位置pi及其对应的所述频率精估计值得到相位的估计值其计算公式 如下:
实施例二:Odd-DFT域正弦信号参数估计方法——低复杂度模式
使用低复杂度模式的Odd-DFT域正弦信号参数估计方法时,切换范围参数 γ=0,在这种情况下,频率的精估计过程得到简化,降低了算法的复杂度。系 统的整体流程与图1所示一致,但其中的步骤3)和步骤4)与普通模式下的不 同。低复杂度模式包括以下步骤:
1)获取正弦信号一个分析帧的Odd-DFT变换系数,记做XO(k),其中, k=0,1,…,N为子带索引,N为变换的子带数。具体步骤如下:
101)给定采样频率为fs的时域含噪正弦信号样本x(n),考虑到x(n)是实信 号,其Odd-DFT系数具有对称性,取连续2N个点作为一帧信号,Odd-DFT变 换的子带数取前N个,即k=0,1,…,N-1。
102)对所述一帧信号加窗,窗函数h(n)为正弦窗,其表达式如下:
得到加窗的时域样本x(n)h(n);
103)对所述加窗的时域样本x(n)h(n),计算其Odd-DFT系数XO(k),计算 公式如下:
2)查找所述一个分析帧的Odd-DFT变换系数XO(k)幅度的极大值及其所在 的子带位置,分别记做|XO(pi)|和pi,其中,i=1,…,l,l为检测到的极大值的个 数,得到频率的粗估计值具体步骤如下:
201)设定正弦分量检测门限Xth,对所述一个分析帧的Odd-DFT变换系数 XO(k)幅度值进行预处理,预处理的结果为Xout(k),其计算公式如下:
202)检测所述Xout(k)的极大值及其所在的子带位置,得到有效的XO(k)幅 度极大值及其所在的子带位置,分别记做|XO(pi)|和pi,其中i=1,…,l,l为检测 到的极大值的个数,则每一个pi位置处对应着一个有效的正弦信号分量。
203)根据所述有效的XO(k)幅度极大值所在的子带位置pi,得到所述有效 的正弦信号分量的频率粗估计值其计算公式如下:
3)根据与所述极大值|XO(pi)|相邻的系数值XO(pi-1)和XO(pi+1),使用 简化的决策算法得到分支决策参数λi,其决策算法如下:
对所述每一个pi位置所对应的有效的正弦频率分量,
若|XO(pi-1)|≥|XO(pi-1)|,则λi=1;
若|XO(pi-1)|<|XO(pi-1)|,则λi=2;
4)使用所述得到的分支决策参数λi,按照对应的频率修正算法,计算每一 个极大值所对应正弦频率分量的频率修正参数得到频率的精估计值具体 步骤如下:
401)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述得到的 分支决策参数λi,计算频率修正参数其计算方法如下:
当λi=1时,
当λi=2时,
402)根据所述得到的频率修正参数和所述频率的粗估计值计算频率 的精估计值其计算公式如下:
5)根据所述得到的频率值按照幅度与相位估计方法,得到每一个极大 值所对应正弦频率分量的幅度值和相位值具体步骤如下:
501)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述极大值 所在位置pi及其对应的所述频率精估计值得到幅度的估计值其计算公 式如下:
502)对所述每一个pi位置所对应的有效的正弦频率分量,根据所述极大值 所在位置pi及其对应的所述频率精估计值得到相位的估计值其计算公式 如下:
实施例三:应用于音频信号处理系统
如图2所示使用Odd-DFT分析与参数估计方法的音频信号处理系统,描述 了把Odd-DFT域参数分析引入到以MDCT分析为基础的音频信号处理系统中时 系统的框图。该应用方式包含以下步骤:
1)输入为时域音频信号x(n),进行Odd-DFT分析时,每连续2N个点作为 一帧信号,相邻帧之间有50%即N点的重叠部分。对一帧信号进行加窗,窗函 数为h(n),得到加窗的时域样本x(n)h(n),然后进行变换得到Odd-DFT系数 XO(k),其计算公式如下:
2)使用得到的Odd-DFT系数XO(k),根据上述普通模式或低复杂度模式的 参数估计方法,得到l个有效正弦频率分量所对应的频率、幅度和相位估计值, 和i=1,2,…,l。
3)使用得到的Odd-DFT系数XO(k),通过Odd-DFT系数→MDCT系数的 转换算法,得到后续音频系统所需要的MDCT系数。具体步骤如下:
301)计算相位因子θ(k),其计算公式如下:
其中k=0,1,…,N-1是Odd-DFT分析的子带索引。
302)对每一个k值,计算相位因子θ(k)的余弦值cosθ(k)和正弦值sinθ(k)。
303)根据得到的相位因子θ(k)的余弦值与正弦值,将Odd-DFT系数XO(k) 转换为MDCT系数XM(k),其计算公式如下:
XM(k)=Re{XO(k)}cosθ(k)+Im{XO(k)}sinθ(k)(14)
可以看出,仅需要两个乘法和一个加法就能够从一个Odd-DFT系数XO(k) 转换为一个MDCT系数XM(k),系数转换的复杂度低。
为了测试本发明所公布方法的有效性,对本发明所提出的方法与现有的两 种Odd-DFT域估计方法(Ferreira2001[11]和Ferreira2005[12])、三种MDCT域 估计方法(Merdjani2003[6]、Zhang2013[8]和Dun2014[9]),以及两种DFT域估 计方法(Quinn1994[3]和Candan2013[5])的频率估计性能进行了比较。本发明 所提方法给出了普通模式和低复杂度模式这两种配置下的实验结果。测试中, Odd-DFT和MDCT分析的子带数设置为1024,一帧数据包含2048个样本点。 所有的Odd-DFT域方法和MDCT域方法在给输入信号加窗时,使用的正弦窗; 两种DFT域方法由于在正弦窗条件下的估算结果偏差过大,所以给出的是矩形 窗条件下的测试结果。
测试一给出了各个算法在单频正弦信号的频率从0增加到fs/2时,频率估 计的均方误差(MSE)曲线图,如图3所示。其中横坐标给出的是信号频率相 对于fs/2的比值,输入信号的信噪比设定为SNR=100dB。图中可以看出,几 乎所有算法都在信号频率为fs/4(横坐标为0.5时)时具有最小的均方误差。 MDCT域的两种算法由于受到相位的干扰而具有不太稳定的输出性能。所有算 法中,本发明所提出的方法具有最小的均方误差值。
测试二给出了各个算法在测试频率大约为1kHz时,不同信噪比条件下对单 频正弦信号进行频率估计的均方误差曲线图,如图4所示。图中给出了实信号 频率估计的克拉美罗界,可以看出本发明所提出的方法依然是具有最小均方误 差值的。
测试三给出了幅度和相位的估计结果。测试中对比了本发明所提出的方法 与现有的Odd-DFT域估计方法(Ferreira[12])中的幅度与相位估计方法,结果 如图5所示。采样频率为fs为44.1kHz,N=1024,数字频率为46时对应的测 试频率大约在1kHz附近。可以看到,本发明所提出的方法明显优于现有算法。
机译: 用于对音频信号进行编码的音频编码器,一种用于对音频信号进行编码的方法以及一种计算程序,该程序考虑了峰值频率范围内可检测到的峰值谱域
机译: 一种基于AI的帕金森氏病诊断信息方法,该方法使用机器学习对NIGROSOME-1区域进行分类,并通过多种学习模型对多种预测结果进行分类
机译: 通过用含次氯酸的灭菌溶液对它们进行灭菌以对食品,烹饪工具和医疗器械进行灭菌的方法以及用一种包含抗菌剂的包装对其进行保存的方法及其保存方法