首页> 中国专利> 音频信号调节设备及音频信号调节方法

音频信号调节设备及音频信号调节方法

摘要

进行与人的实际听觉级别相匹配的音量控制,从而改善控制精度。如图所示,音频增益调节设备10包括:音频信号输入部12,其获取要调节的音频信号;长期增益反映部14,其在所获取音频信号中反映长期增益的调节;分频部20,其将来自长期增益反映部14的音频信号分割成3个频带;短期增益反映部30,其在各频带中反映短期增益的调节;合成部40,其合成从短期增益反映部30输出的音频信号;以及音频信号输出部42,其输出所合成音频信号。

著录项

  • 公开/公告号CN102257728A

    专利类型发明专利

  • 公开/公告日2011-11-23

    原文格式PDF

  • 申请/专利权人 夏普株式会社;

    申请/专利号CN200980151666.4

  • 发明设计人 后田成文;

    申请日2009-10-15

  • 分类号H03G9/06(20060101);G10L21/02(20060101);H03G3/20(20060101);H03G5/16(20060101);H03G7/00(20060101);H04R3/04(20060101);

  • 代理机构31100 上海专利商标事务所有限公司;

  • 代理人李玲

  • 地址 日本大阪府

  • 入库时间 2023-12-18 03:51:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-11-26

    授权

    授权

  • 2012-01-04

    实质审查的生效 IPC(主分类):H03G9/06 申请日:20091015

    实质审查的生效

  • 2011-11-23

    公开

    公开

说明书

技术领域

本发明涉及音频信号调节设备及音频信号调节方法,且更具体地,涉及通过自动增益调节来调节音频信号的音频信号调节设备及音频信号调节方法。

背景技术

当今,存在诸如数字广播、VOD(视频点播)广播、DVD(数字多功能盘)、以及蓝光盘的各种媒体源,且用户在自由地从一个源切换到另一源的同时,享受这些源。但是,各源的生产商或广播站不同,使得媒体源之间的音频记录电平或音频动态范围通常不同,导致在从一个节目切换到另一节目或从一个源切换到另一源时的不堪入耳的超高声音输出或较差声音输出。因此,每次音量有变时,用户需要调节音量至期望级别,这带来不便。

提出了用于调节媒体源之间的音量或动态范围的以上不同的一些技术。例如,一公知技术为,通过分频针对各所得信号进行增益调节,并再次相加所得信号以用于平均信号电平(参考专利文献1)。利用该技术防止高频成分的缺失,由此防止声音变得不清楚。

[引用列表]

[专利文献]

[专利文献1]日本专利申请公开No.2003-299181

发明的公开内容

本发明要解决的问题

在专利文献1所公开的技术中,因为增益相对于输入信号的电压值而改变,音量控制不对应于人的实际听觉级别,因此需要在控制精度方面作出改进。此外,在整体上级别高(或低)的情况下,相对于输入信号改变的增益改变量大,其不利地增大输出信号的波动。

本发明的目的在于提供一种用于进行与人的实际听觉级别相匹配的音量控制的技术,从而改进控制精度。

解决这些问题的手段

根据本发明的设备涉及音频信号调节设备。该设备包括:长期增益调节装置,其用于长期地相对地控制输入信号的振幅;以及短期增益调节装置,其用于短期地相对地控制输入信号的振幅。

当控制输入信号的振幅时,长期增益调节装置可将输入信号转换成响度级别,响度级别是基于人的听觉的级别。

当控制输入信号的振幅时,短期增益调节装置可将输入信号转换成响度级别,响度级别是基于人的听觉的级别。

长期增益调节装置可反映音频输出装置的输出音压特性以便控制输入信号的振幅,音频输出装置是音频信号调节设备的信号的输出目的地。

短期增益调节装置可反映音频输出装置的输出音压特性以便控制输入信号的振幅,音频输出装置是音频信号调节设备的信号的输出目的地。

长期增益调节装置及短期增益调节装置各自可基于缓冲一定时间周期的输入信号来控制振幅。

缓冲一定时间周期的输入信号可以是预读信号。

长期增益调节装置可反映已经历先前的长期增益调节的输入信号,从而进行反馈控制。

短期增益调节装置可反映已经历由长期增益调节装置进行的长期增益控制的信号,从而进行控制。

短期增益调节装置可针对输入信号的音频带及其它带的每一个控制输入信号的振幅。

短期增益调节装置可在控制短期增益的振幅时根据输入信号的上升度来改变起动时间。

短期增益调节装置可基于输入信号的响度级别与响度级别的标准偏差及平均值来计算输入信号上升度。

短期增益调节装置在控制短期增益的振幅时可根据输入信号的响度级别的上升度来改变短期增益的振幅量。

短期增益调节装置可在每次其计算输入信号的目标增益时计算短期增益的改变宽度。

长期增益调节装置可根据短期增益调节装置中的短期增益的控制中的改变来调节长期增益。

此外,音频信号调节设备可包括:比较装置,其用于比较输入信号的级别与预设阈值级别以便计算差级别;级别改变度计算装置,其用于比较给定过去时间周期内所输入的输入信号的级别与当前输入的级别以便计算级别改变度;增益调节量计算装置,其用于根据在比较装置中所计算的差级别计算在要应用到输入信号的增益调节处理中所使用的增益的调节量;以及增益调节装置,其用于根据在增益调节量计算装置中所计算的增益调节量对输入信号进行调节。

此外,音频信号调节设备可包括:源/内容识别装置,其用于识别输入信号的源或包括输入信号的内容的分类,且增益调节量计算装置可能能够依赖于由源/内容识别装置所识别的源或分类来设置增益调节量的计算过程。

本发明的另一方面涉及音频信号调节方法。该方法包括:长期增益调节步骤,其长期地相对地控制输入信号的振幅;以及短期增益调节步骤,其短期地相对地控制输入信号的振幅。

当控制输入信号的振幅时,长期增益调节步骤可将输入信号转换成响度级别,响度级别是基于人的听觉的级别。

当控制输入信号的振幅时,短期增益调节步骤可将输入信号转换成响度级别,响度级别是基于人的听觉的级别。

长期增益调节步骤可反映音频输出装置的输出音压特性以便控制输入信号的振幅,音频输出装置是由音频信号调节方法所控制的信号的输出目的地。

短期增益调节步骤可反映音频输出装置的输出音压特性以便控制输入信号的振幅,音频输出装置是由音频信号调节方法所控制的信号的输出目的地。

长期增益调节步骤及短期增益调节步骤各自可基于缓冲一定时间周期的输入信号来控制振幅。

缓冲一定时间周期的输入信号可以是预读信号。

长期增益调节步骤可反映已经历先前的长期增益控制的输入信号,从而进行反馈控制。

短期增益调节步骤可反映已经历由长期增益调节步骤进行的长期增益控制的信号,从而进行控制。

短期增益调节步骤可针对输入信号的音频带及其它带的每一个控制输入信号的振幅。

短期增益调节步骤在控制短期增益的振幅时可根据输入信号的上升度来改变起动时间。

短期增益调节步骤可基于输入信号的响度级别与响度级别的标准偏差及平均值来计算输入信号的上升度。

短期增益调节步骤在控制短期增益的振幅时可根据输入信号的响度级别的上升度来改变短期增益的振幅量。

短期增益调节步骤可在每次其计算输入信号的目标增益时计算短期增益的改变宽度。

长期增益调节步骤可根据短期增益调节步骤中的短期增益的控制中的改变来调节长期增益。

本发明的又一方面涉及音频信号调节设备。该设备包括:比较装置,其用于获取输入信号并比较输入信号的级别与预设阈值级别以便计算差级别;级别改变度计算装置,其用于比较给定过去时间周期内所输入的输入信号的级别与当前输入的输入信号级别以便计算级别改变度;增益调节量计算装置,其用于基于在比较装置中计算的差级别、及在级别改变度计算装置中计算的级别改变度来计算压缩比,以及根据所计算压缩比计算增益调节量;以及增益调节装置,其用于根据在增益调节量计算装置中所计算的增益调节量对输入信号进行调节。

本发明的又一方面涉及音频信号调节设备。该设备包括:比较装置,其用于获取输入信号并比较输入信号的级别与预设阈值级别以便计算差级别;级别改变度计算装置,其用于比较给定过去时间周期内所输入的输入信号的级别与当前输入的输入信号级别以便计算级别改变度;增益调节量计算装置,其用于基于在比较装置中计算的差级别、及在级别改变度计算装置中计算的级别改变度来计算针对增益调节量计算的阈值,以及根据所计算阈值计算增益调节量;以及增益调节装置,其用于根据在增益调节量计算装置中所计算的增益调节量对输入信号进行调节。

本发明的又一方面涉及音频信号调节设备。该设备包括:比较装置,其用于获取输入信号并比较输入信号的级别与预设阈值级别以便计算差级别;级别改变度计算装置,其用于比较给定过去时间周期内所输入的输入信号的级别与当前输入的输入信号级别以便计算级别改变度;增益调节量计算装置,其用于基于在比较装置中计算的差级别、及在级别改变度计算装置中计算的级别改变度来计算针对增益调节量计算的阈值以及压缩比,以及根据所计算阈值及压缩比计算增益调节量;以及增益调节装置,其用于根据在增益调节量计算装置中所计算的增益调节量对输入信号进行调节。

发明优点

根据本发明,有可能进行与人的实际听觉级别相匹配的音量控制,由此改进控制精度。

附图简述

图1是根据本发明第一实施例的音频增益调节设备的功能框图。

图2是根据第一实施例的长期增益计算部的功能框图。

图3是示意性地示出在根据第一实施例的音频增益调节设备中进行的短期增益调节处理的过程的流程图。

图4是根据第一实施例的短期增益计算部的功能框图。

图5是示出在根据第一实施例的短期增益计算部的压缩部中执行的处理的流程图。

图6是示出在根据第一实施例的短期增益计算部的放大部中执行的处理的流程图。

图7(a)和7(b)是各自示出由根据第一实施例的音频增益调节设备进行的自动增益调节处理的实验结果的图表。

图8是根据第一实施例变体的音频增益调节设备的长期增益计算部的功能框图。

图9是根据第一实施例变体的音频增益调节设备的短期增益计算部的功能框图。

图10是示意性地示出根据第三实施例的音频增益调节设备的配置的功能框图。

图11是示出根据第三实施例的计算过程1的(a)中的级别改变度与压缩比之间的关系的视图。

图12是示出根据第三实施例的计算过程1的(b)中的级别改变度与压缩比之间的关系的视图。

图13是示出根据第三实施例的计算过程1的(c)中的级别改变度与压缩比之间的关系的视图。

图14是示出根据第三实施例的计算过程2的(a)中的级别改变度与阈值之间的关系的视图。

图15是示出根据第三实施例的计算过程2的(b)中的级别改变度与阈值之间的关系的视图。

图16是示出根据第三实施例的计算过程2的(c)中的级别改变度与阈值之间的关系的视图。

图17是示出根据第三实施例的计算过程3中的输入级别与输出级别之间的关系的视图。

图18是示出根据第三实施例的计算过程3中的输入级别与输出级别之间的关系的视图。

图19是示出根据第三实施例的计算过程3中的输入级别与输出级别之间的关系的视图。

图20是根据第四实施例的音频增益调节设备的功能框图。

图21是示出根据第四实施例变体的音频增益调节设备的压缩目标增益计算部的配置的功能框图。

用于实现本发明的最佳模式

现在将参考诸附图具体描述用于实现本发明的实施例(以下仅称作“实施例”)。

<第一实施例>

首先,将给出第一实施例的概要。以下描述的音频增益调节设备10对输入设备进行长期增益调节,使用分带滤波器对所得输出信号进行频带分割,针对各频带的输出信号进行短期增益调节,以及合成输出信号以便获得最终输出信号。

通过将已经历长期增益处理的一定时间周期内的信号转换成人的听觉级别(此后称作“响度级别”)并比较响度级别与设置阈值(压缩阈值或放大阈值)来获取长期增益。作为响度级别可使用由ITU-R(国际电信联盟广播通信部)标准所规定的反映响度曲线的级别。更具体地,可通过反转由响度曲线表示的特性来获取响度级别。压缩阈值是在进行信号压缩处理时所参照的阈值。放大阈值是在进行信号放大处理时所参照的阈值。除了以上的阈值之外,设置下限阈值以便防止背景噪声等被放大。

通过将已经过带通滤波器(BFP)的一定时间周期内的信号转换成响度级别并将响度级别同已经历长期增益调节的响度级别一起与对应的阈值相比较来获取短期增益的目标值,从而计算短期增益目标值。同时,计算增益达到目标值所需的起动时间及释放时间。使短期增益基于所计算目标值、起动时间、以及释放时间而改变。以上所描述的功能允许将声音调节成听觉友好级别,其在操作音量控制中节省用户的时间及能量。本实施例中所使用的术语“长期”及“短期”各自意味着相对时间周期,且“长期”被假定为比“短期”长30倍的时间周期,且假定为适应性地更新。根据以上处理,有可能确保内容(源)的生产商所期望的动态范围。

图1是示意性地示出根据本实施例的音频增益调节设备10的配置的功能框图。该音频增益调节设备10安装在电视机或音频系统中。构成本实施例的各个组件各自由诸如DSP(数字信号处理器)的LSI(大规模集成电路)、存储器、或任意程序来实现。如图1所示,音频增益调节设备10包括:音频信号输入部12,其获取要调节的音频信号;长期增益反映部14,其在所获取音频信号中反映长期增益的调节;分频部20,其将来自长期增益反映部14的音频信号分割成3个频带;短期增益反映部30,其在各频带中反映短期增益的调节;合成部40,其合成从短期增益反映部30输出的音频信号;以及音频信号输出部42,其输出所合成的音频信号。

音频增益调节设备10还包括:长期增益计算部50,其计算在长期增益反映部14中所使用的长期增益;以及短期增益计算部60,其计算在短期增益反映部30中所使用的短期增益。在本实施例中,长期增益计算部50的计算结果不仅用在长期增益反映部14中,还用在短期增益计算部60中以用于计算短期增益。

分频部20包括LPF 22、HPF 24、以及BPF 26。短期增益反映部30包括低频反映部32、高频反映部34、以及中频反映部36。

在本实施例中,LPF 22向低频反映部32输出100Hz或更小的频带的信号。HPF 24向高频反映部34输出8000Hz或更大的频带的信号。BPF 26向中频反映部34以及要在以后描述的短期增益计算部60的放大部70输出100Hz到8000Hz的频带的信号。低频反映部32、高频反映部34、以及中频反映部36将在短期增益更新部90中所计算的短期增益的改变量反映在从LPF 22、HPF 24及BPF 26所获取的信号中,并向合成部40输出所得信号。

尽管将在以下描述细节,中频反映部36从短期增益更新部90的第一更新部92获取短期增益改变量,而低频反映部32及高频反映部34从短期增益更新部90的第二更新部94获取短期增益的改变量。输入到音频信号输入部12的信号的响度级别被假定为“响度级别1”,已经历长期增益反映部14中的长期增益调节的信号的响度级别被假定为“响度级别2”,以及已经历中频反映部36中的滤波的信号的响度级别被假定为“响度级别3”。

图2是根据本施例的长期增益计算部50的功能框图。如图所示,长期增益计算部50包括音频信号存储部52、响度级别转换部54、级别比较/计数部56、以及长期增益更新部58。

音频信号存储部52获取长期增益反映部14的输出,并将其存储为缓冲器中仅持续预定时间周期的一个帧。在此,例如,10毫秒(ms)被假定为预定时间。

响度级别转换部54从音频信号存储部52获取一帧的音频信号,并计算响度级别2。在响度级别转换部54中计算的响度级别2输出到级别比较/计数部56以及要在以后描述的压缩部80的短期增益计算部60。

级别比较/计数部56如上所述地确定输入级别相对于压缩阈值及放大阈值长期地处于何处。具体地,级别比较/计数部56具有用于长期增益控制的计数器功能,并将计数器的初始值设为“0”并将长期增益的初始值设为“0dB”。然后,在每个帧基础上执行以下处理(1)至(4)。

(1)当已经历长期增益调节的响度级别2超过压缩阈值时,计数值增大“1”。

(2)当已经历长期增益调节的响度级别2下降成低于放大阈值时,计数值减小“1”。

(3)如果以上情形(1)及(2)不发生,在长期增益设回初始值的方向中计数值增大或减小“1”。

(4)当计数值在(1)至(3)的处理后达到预设值时,长期增益更新或大或小的一步,且计数值被重设成初始值“0”。在该示例中,当计数值超过“预定上限阈值”时,长期增益减小“0.2dB”。当计数值低于“预定下限阈值”时,长期增益增大“0.2dB”。要注意,长期增益限制在±4.0的范围,使其调节范围不会变得过宽。然后,长期增益更新部58通知长期增益反映部14长期增益值。

接下来将描述短期增益调节处理。图3是示意性地示出短期增益调节处理的过程的流程图。在短期增益调节处理中,响度级别2和响度级别3用于确定控制量。在图3与以下要描述的图5及图6中,信号、阈值、以及增益如下地表示。

响度级别1至3:L1至L3

压缩阈值:Th_cmp

放大阈值:Th_amp

增益:G

目标增益:Gt

临时目标增益:Gd

首先,比较响度级别2与压缩阈值(S10)。当响度级别2超过压缩阈值(S10为Y)时,进行压缩处理(S20)。当响度级别2不超过压缩阈值(S10为N)时,比较响度级别3与放大阈值(S30)。当响度级别3不高于放大阈值(S30为N)时,进行放大处理(S40)。当响度级别3高于放大阈值(S30为Y)时,进行收敛处理(S50)。收敛处理是用于使增益收敛到“1”的处理。

虽然以下将在图5和图6中描述处理细节,通过执行以上流程中描述的处理步骤,根据短期地控制输入级别的功能,有可能在从一个节目切换到另一节目、从一个内容切换到另一内容,或从一个场景切换到另一场景、或节目的一场景中的爆炸声产生等的时候,声音级别突然增大时抑制音量的改变。此外,当音频带级别(在BPF 26中滤波后的频带输出)小的情况下,输出带升高成使对话易于听到。短期增益要求比长期增益所要求的更快的增益调节,以使做出对听觉的自然性产生巨大影响的控制。作为收听者可能感觉声音级别中的波动的模式,可采取在音频信号处于稳态时增益改变的情形。在本实施例中,分析音频信号的稳态,并进行控制从而避免增益在稳态中突然改变。

图4是具体示出短期增益计算部60的功能框图。短期增益计算部60包括:放大部70,其确定调节增益中所使用的增益调节量以便易于听取大部分人的对话;压缩部80,其压缩整体信号级别并确定声音级别突然增大时的调节增益中所使用的调节量;短期增益更新部90,其在信号中反映所确定的调节量。短期增益更新部90包括:第一更新部92,其在中频反映部36中反映放大部70及压缩部80的处理结果;以及第二更新部94,其在低频反映部32及高频反映部34两者中反映压缩部80的处理结果。

压缩部80包括:长期增益调节部81、级别阈值比较部82、压缩目标增益计算部83、压缩增益改变宽度计算部84、响度级别存储部85、平均级别计算部86、级别标准偏差计算部87、以及级别上升沿检测部88。

图5是示出主要在压缩部80中执行的处理的流程图。在压缩部80中执行的压缩处理将根据图5的流程图来描述,之后描述对应于相应步骤的组件。

在压缩处理中,确定增益是否高于预定值(在该情况下为“0dB”)(S201)。当增益不高于“0dB”(S201为Y)时,确定未进行放大。在该情况下,作为一般处理,基于预设起动时间及释放时间根据当前增益及压缩目标增益计算各样本的增益的改变宽度(S202)。

当增益高于“0dB”(S201为N)时,确定增益是否高于“预定阈值Th_g”(S203)。当当前增益高于“预定阈值Th_g”(S203为Y)时,确定放大过度,且用放大增益的上限值更新当前增益。但是,存在放大期间的快速降低可导致不自然的听觉的可能性。因此,仅在满足以下条件(S204)时,在S202的一般处理中进行快速压缩处理。具体地,以下条件(1)至(3)(一同被称作“条件A”)被同时满足时或当以下条件(4)(条件B)被满足(S204为Y)时进行快速压缩处理。在此,例如,起动时间设置成10ms。

条件A:

(1)增益比压缩阈值高10dB或更高;

(2)当前响度级别2是比前一响度级别2的峰值高的第一预定值(例如,约数dB);

(3)平均值与当前响度级别2之间的差是比标准偏差σ的预定倍数(m×σ)高的第二预定值(例如,约数dB);

条件B:

(4)平均值与当前响度级别2之间的差是比标准偏差σ的预定倍数(m×σ)高的第三预定值(第三预定值比第二预定值大)。

当满足条件A或条件B时,作出确定响度级别1是否超过压缩阈值的级别阈值比较处理。然后,当确定响度级别1超过压缩阈值时,根据放大阈值与当前响度级别之间的差重新计算压缩目标增益。

当在步骤S203中增益低于“预定阈值Th_g”(S203为N)时,或在S204中条件A或条件B未被满足(S204为N)时,设置速度比一般处理低的压缩处理(S205)。在此,例如,起动时间设置成100ms。

接下来,将描述用于执行以上压缩处理的压缩部80的配置。

响度级别存储部85存储从响度级别转换部54获取的一定数量的响度级别2。在该示例中,例如,存储40个(500ms)响度级别2。

平均级别计算部86计算存储在响度级别存储部85中的响度级别2的平均值。

随后,级别标准偏差计算部87根据存储在响度级别存储部85的响度级别2以及在平均级别计算部86中计算的响度的平均值来计算标准偏差σ。

级别上升沿检测部88分析响度级别2的上升度。具体地,级别上升沿检测部88确定是否满足条件A或条件B。

长期增益调节部81从长期增益计算部50的长期增益更新部58获取长期增益值,在从响度级别转换部54获取的响度级别中反映值的反转特性,计算原信号的响度级别1,以及向级别阈值比较部82输出所计算的响度级别1。

级别阈值比较部82执行比较从响度级别转换部54获取的响度级别2与从长期增益调节部81获取的响度级别1的级别阈值比较处理。

然后,如上所述,压缩目标增益计算部83接收级别阈值比较处理的结果并按照需求根据压缩阈值与当前响度级别的差重新计算压缩目标增益。

压缩增益改变宽度计算部84基于压缩目标增益计算部83及级别上升沿检测部88中所进行的处理结果,根据当前增益与压缩目标值的差来计算各样本的增益改变量,并通知短期增益更新部90所计算的增益改变量。

接下来,将描述S40中的放大处理及放大部70。放大部70包括音频信号存储部71、响度级别转换部72、级别阈值比较部73、级别上升沿检测部74、放大目标增益计算部75、以及放大增益改变宽度计算部76。

图6是主要示出在放大部70中执行的处理的流程图。将在以下根据图6的流程图以及彼此相关联的放大部70的组件及图4中的放大部70来描述放大处理。

音频信号存储部71获取BPF 26的输出并将其存储为缓冲器中仅持续预定时间周期的一个帧。在此,例如,如在长期增益计算部50的音频信号存储部52中,假定12.5ms为预定时间。

响度级别转换部72计算各帧的响度级别。

级别阈值比较部73确定针对各帧所计算的响度级别是否落在放大阈值及下限阈值之间。即,级别阈值比较部73确定响度级别是否低于放大阈值并超出下限阈值。在此,设置下限阈值以用于忽略噪声。

级别上升沿检测部74分析响度级别的上升度(S401)。级别上升沿检测部74分析从BPF 26获取的信号(即,人声频带的信号)的响度级别。然后,当满足全部的以下条件(1)至(4)(一同称作“条件C”)(S401为Y)时,级别上升沿检测部74设置放大目标增益(S402、S403)。

条件C:

(1)当前增益不低于0.9;

(2)两个连续响度级别3增大;

(3)(2)的连续增大的值不小于预定值;以及

(4)(2)的连续增大的开始值不小于下限阈值。

放大目标增益计算部75计算上升度(S402),计算离放大阈值的差(S403),以及基于这些值及放大增益上限值确定放大目标增益(S404)。

此后,放大目标增益计算部75根据当前增益及放大目标增益计算各样本的增益改变量,并通知短期增益更新部90所计算的增益改变量(S405)。

当在S401中不满足条件C(S401为N)时,放大目标增益计算部75单从放大阈值与响度级别3之间的差计算临时目标增益(S406),并比较临时目标增益与当前目标增益(S407)。

当临时目标增益低于当前目标增益(S407为N)时,放大目标增益计算部75将所计算临时目标增益设置为目标增益(S408)。当临时目标增益不低于当前目标增益(S407为Y)时,放大目标增益计算部75将保持当前目标增益不变(S409)。

然后,短期增益更新部90的第一更新部92计算各样本的增益,使得增益在朝着压缩目标增益或放大目标增益的方向上改变。第一更新部92通知中频反映部36所计算的增益,且中频反映部36根据所通知的增益来调节信号增益。类似地,第二更新部94计算各样本的增益,使得增益在朝着压缩目标增益的方向上改变。第二更新部94通知低频反映部32及高频反映部34所计算的增益,且低频反映部32及高频反映部34各自根据所通知的增益来调节信号增益。

在此,将描述短期增益的计算处理的概要。该增益也基于响度级别2与响度级别3来计算。在计算目标增益的时间点上,该时刻的短期增益被转换成先前增益,且当前增益乘“1”。之后,使当前增益变化。因此,用先前增益及当前增益的乘积来表达短期增益。

将描述压缩处理S20已被执行的情况下的,即,响度级别2高于压缩阈值的情况下的计算短期增益的过程。

(1)当先前增益与当前增益的乘积高于压缩增益目标时,增益减小。

(2)当先前增益与当前增益的乘积不高于压缩增益目标时,比较先前增益与当前增益之间的差以及增益改变宽度。当差不大于增益改变宽度时,由压缩增益目标来替代先前增益与当前增益的乘积。当差大于增益改变宽度时,当前增益增大增益改变宽度。

将描述放大处理S40已被执行的情况下的,即,响度级别3高于放大阈值的情况下的计算短期增益的过程。

(1)当先前增益与当前增益的乘积不高于放大目标增益时,当前增益增大所计算的改变宽度。

(2)当先前增益与当前增益的乘积高于放大增益目标时,比较先前增益与当前增益之间的差。当差不大于在S405中计算的增益改变宽度时,由压缩增益目标来替代先前增益与当前增益的乘积。当差大于增益改变宽度时,当前增益减小改变宽度。

当进行收敛处理S50时,使当前增益变化,以使先前增益与当前增益的乘积变得靠近“1”。当先前增益与当前增益的乘积大于“1”时,当前增益减小。当在进一步减小当前增益后先前增益与当前增益的乘积低于“1”时,将当前增益调节成使先前增益与当前增益的乘积变为“1”。当先前增益与当前增益的乘积不大于“1”时,当前增益增大。当在进一步增大当前增益后先前增益与当前增益的乘积超过“1”时,将当前增益调节成使先前增益与当前增益的乘积变为“1”。

图7(a)及7(b)示出未应用在以上配置中进行及根据以上处理流程的自动增益调节处理的结果的情况(图7(a))以及应用自动增益调节处理的结果的情况(图7(b))。如图7(a)与7(b)清楚地示出,图7(b)中的音量级别的改变小于图7(a)中的音量级别的改变。

如上所述,根据本实施例的自动增益调节处理,有可能允许将声音调节成听力友好级别,同时在一定程度上确保内容生产商所期望的动态范围。这在操作音量控制时节省用户的时间及能量。

已基于以上实施例描述本发明。要理解,对于本领域技术人员而言,以上实施例仅仅是本发明的示例,可对本发明的组件及组合作出许多修改,且所有这种变体可包含在本发明的范围中。

例如,短期增益反映部30可仅包括中频反映部36以便允许仅控制人声频带的信号。在该配置中,相比于包含低频反映部32及高频反映部34的配置,效果降低,然而实现处理负荷的降低。

此外,可采用一种配置,在该配置中在长期增益计算部中的处理中反映短期增益计算部60的结果。例如,在长期增益的增大期间,由于突然从一个场景切换到另一场景,音量级别整体增大的情况下,短期增益显著降低。此时,可能发生在短期增益改变中的波动。为了处理此,当确定长期增益在增大时,长期增益的减小速度在短期增益的显著减小后可暂时增大。这允许减小波动。此外,BPF 26及中频反映部36可各自分割成多个块。

图8和图9示出根据变体的音频增益调节设备10的长期增益计算部50a及短期增益计算部60a的功能框图。在上述的实施例中,基于反映人的听觉的响度特性作出自动增益调节。另一方面,在本变体中,诸如扬声器的输出装置的特性也被反映在自动增益调节中。根据本变体的音频增益调节设备10可具有类似于上述实施例的配置,从而基于诸附图将仅描述不同点。

本变体的长期增益计算部50a包括音频信号存储部52与响度级别转换部54之间的输出音压特性应用部53,其用于在自动增益调节中反映扬声器等的特性。类似地,短期增益计算部60a的放大部70a包括音频信号存储部71与响度级别转换部72之间的输出音压特性应用部77,其用于在自动增益调节中反映扬声器等的特性。这消除由扬声器等的输出特性造成的不必要的音量控制(自动增益调节),由此增强控制精度。

<第二实施例>

在第二实施例中进行的处理在一些点上不同于第一实施例。

第一不同点为在级别比较/计数部56中进行的处理。具体地,如第一实施例,级别比较/计数部56具有用于长期增益控制的计数器功能,并将计数器的初始值设为“0”并将长期增益的初始值设为“0dB”。然后,执行以下处理(1)至(4)。只有处理(3)不同与第一实施例的处理。

(1)当已经历长期增益调节的响度级别2超过压缩阈值时,计数值增大“1”。

(2)当已经历长期增益调节的响度级别下降成低于放大阈值时,计数值减小“1”。

(3)当已经历长期增益调节的响度级别2低于下限阈值时,在回到初始值的方向上对长期增益进行计数。

(4)当计数值在(1)至(3)的处理后达到预设值时,长期增益更新或大或小的一步,且计数值被重设成初始值“0”。然后,如第一实施例,当计数值超过“预定上限阈值”时,长期增益减小“0.2dB”。当计数值低于“预定下限阈值”时,长期增益增大“0.2dB”。要注意,长期增益限制在±4.0的范围,使其调节范围不会变得过宽。然后,长期增益更新部58通知长期增益反映部14长期增益值。

第二不同点是短期增益调节处理。具体地,图3的压缩处理(S20),即,图5的处理中的条件及处理内容不同于第一实施例的。

在第二实施例的压缩处理中,确定增益是否高于预定值(在该情况下为“0dB”)(S201)。当增益不高于“0dB”(S201为Y)时,确定未进行放大。在该情况下,作为一般处理,基于预设起动时间及释放时间根据当前增益及压缩目标增益计算各样本的增益的改变宽度(S202)。

当增益高于“0dB”(S201为N)时,仅在满足以下条件时进行快速压缩处理(S204)。省略S203的后续处理。即,用于进行压缩处理的条件不同,其用于避免放大期间的归因于增益的快速减小的不自然听觉的发生。具体地,当同时满足以下条件(1)和(2)(一同称作“条件A1”,对应于图5的条件A)或满足以下条件(3)(条件B1,对应于图5的条件B)(S204为Y)时,在一般处理S202中进行快速压缩处理。在此,例如,起动时间设置成1.0ms。不同点为省略第一实施例的条件A的(2)。

条件A1:

(1)增益比压缩阈值高10dB或更高;

(2)平均值与当前响度级别2之间的差是比标准偏差σ的预定倍数(m×σ)高的第二预定值(例如,约数dB);

条件B1;

(3)平均值与当前响度级别2之间的差是比标准偏差σ的预定倍数(m×σ)高的第三预定值(第三预定值比第二预定值大)。

当满足条件A1或条件B1时,作出确定响度级别1是否超过压缩阈值的级别阈值比较处理。然后,当确定响度级别1超过压缩阈值时,根据压缩阈值与当前响度级别之间的差重新计算压缩目标增益。

在S204中不满足条件A1或条件B1(S204为N)时,设置速度比一般处理低的压缩处理(S205)。在此,例如,起动时间设置成100ms。

用于执行以上压缩处理的压缩部80的配置与第一实施例的相同。

第三不同点为图3的放大处理(S40)的内容,即,图6的处理中的条件及处理内容不同于第一实施例的。

级别上升沿检测部74分析响度级别的上升度(S401)。级别上升沿检测部74分析从BPF 26获取的信号(即,人声频带的信号)的响度级别。然后,当满足全部的以下条件(1)至(4)(一同称作“条件C1”,对应于图6的条件C)(S401为Y)时,级别上升沿检测部74设置放大目标增益(S403)。

条件C1;

(1)当前增益不低于0.99;

(2)两个连续响度级别3增大;

(3)(2)的连续增大的值不小于预定值;以及

(4)(2)的连续增大的开始值不小于下限阈值。

放大目标增益计算部75计算与放大阈值的差(S403),并基于差及放大增益上限值确定放大目标增益(S404)。即,省略第一实施例的处理S402。例如,由“以上差×长期增益”所获得的值小于预定最大放大值时,将差设置为放大目标增益。否则,由“最大放大值/长期增益”所获得的值被设置为放大目标增益。此外,如以上清楚地示出,条件C1的(1)中的值(0.99)不同于第一实施例的条件C的(1)中的(0.9)。

此后,放大目标增益计算部75根据当前增益及放大目标增益计算各样本的增益改变量,并通知短期增益更新部90所计算的增益改变量(S405)。

当在S401中不满足条件C1(S401为N)时,放大目标增益计算部75单从放大阈值与响度级别3之间的差计算临时目标增益(S406),并比较临时目标增益与当前目标增益(S407)。

当临时目标增益低于当前目标增益(S407为N)时,放大目标增益计算部75将所计算临时目标增益设置为目标增益(S408)。当临时目标增益不低于当前目标增益(S407为Y)时,放大目标增益计算部75将保持当前目标增益不变(S409)。此时,放大目标增益计算部75向一帧的长度设置放大释放时间,并重新计算释放时间的改变宽度,即各步骤的增益的增大宽度。

然后,短期增益更新部90的第一更新部92计算各样本的增益,使得增益在朝着压缩目标增益或放大目标增益的方向上改变。第一更新部92通知中频反映部36所计算的增益,且中频反映部36根据所通知的增益来调节信号增益。类似地,第二更新部94计算各样本的增益,使得增益在朝着压缩目标增益的方向上改变。第二更新部92通知低频反映部32及高频反映部34所计算的增益,且低频反映部32及高频反映部34各自根据所通知的增益来调节信号增益。

在此,将描述短期增益的计算处理的概要。该增益也基于响度级别2与响度级别3来计算。在第一实施例中使用先前增益与当前增益的乘积,而在本实施例中使用短期增益。

将描述本实施例的压缩处理S20已被执行的情况下的,即,响度级别2高于压缩阈值的情况下的计算短期增益的过程。

(1)当短期增益高于压缩增益目标时,减小短期增益。

(2)当短期增益不高于压缩增益目标时,比较短期增益与增益改变宽度。当短期增益与增益改变宽度之间的差小于增益改变宽度时,由压缩增益目标来替代短期增益。此外,当上述差大于增益改变宽度时,短期增益增大增益改变宽度。

将描述放大处理S40已被执行的情况下的,即,响度级别3高于放大阈值的情况下的计算短期增益的过程。

(1)当短期增益不高于放大目标增益时,短期增益增大所计算的增益改变宽度。

(2)当短期增益高于放大目标增益时,比较短期增益与放大目标增益之间的差。当差不大于在S405中所计算的增益改变宽度时,由放大目标增益来替代短期增益。当差大于增益改变宽度时,短期增益减小增益改变宽度。

当进行收敛处理S50时,使当前增益变化,以使短期增益靠近“1”。当短期增益大于“1”时,当前增益减小。当短期增益在进一步减小当前增益后低于“1”时,将当前增益调节成使短期增益变为“1”。当短期增益不大于“1”时,当前增益增大。当短期增益在进一步增大当前增益后超过“1”时,将当前增益调节成使短期增益变为“1”。

如上所述地,可根据本实施例获得与第一实施例相同的效果。

<第三实施例>

在本实施例中,将描述从一个输入源切换到另一输入源或在一个源中从一个场景切换到另一场景时的音量控制。可能存在在电视机或音频系统中从一个输入源切换到另一输入源时或在一个源中从一个场景切换到另一场景时,音量级别突然显著改变的情形。在这种情形下,观众相应地感觉不舒服或感到惊讶,迫使他或她频繁地调节音量。为了解决这种问题,已经使用自动调节增益的称作ALC(自动级别控制)或DRC(动态范围压缩)的技术。以上技术仅相对于超过阈值级别的量以恒定速率来削弱信号,阈值级别是相应于输入源的音量级别而设置的。

人在各种影响下感觉响度,诸如各种影响不仅有达到听众的耳朵的音压级别,还有频率特性及改变当前音压级别的方式。例如,假设音压级别相同,从无声情况下形成的音往往会感觉更响。因此,相对于超过阈值级别的声信号(音频信号)以恒定速率削弱信号的技术可能达不到充分的效果。

因此,在本实施例中,增益调节方法不仅取决于瞬间音量级别还取决于前一音频信号的音量级别的状态而变化。该方法用于减轻观众的不适感。即,当输入信号(声信号或音频信号)的音量超过预设阈值级别时,增益调节量取决于再现的先前音频信号的音量级别的状态而改变直到超过阈值前的时间点。将在以下描述细节。

图10是示意性地示出根据本实施例的音频增益调节设备110的配置的功能框图。该音频增益调节设备110安装在电视机或音频系统中。如图所示,音频增益调节设备110包括音频信号输入部112、增益调节部120、增益控制器130、以及音频信号输出部142。

音频信号输入部112具有类似于第一实施例的音频信号输入部12的功能,并且获取要调节的音频信号。增益调节部120根据增益控制器130的计算结果向音频信号施加增益调节。音频信号输出部142输出已经历增益调节的音频信号,类似于第一实施例的音频信号输出部42。

增益控制器130包括阈值级别比较部132、级别改变度计算部134、增益调节量计算部136、以及源识别部138。

阈值级别比较部132比较从音频信号输入部112输入到其的音频信号的级别值与预设阈值级别以便计算差级别。

级别改变度计算部134比较在给定过去时间周期(例如1秒)内输入的音频信号的级别与当前输入的音频信号的级别以便计算级别改变度,并通知增益调节量计算部136所计算的级别改变度。在包括该给定过去时间周期的预定时间周期内的音频信号级别存储在级别改变度计算部134中。

当在阈值级别比较部132中计算的差级别为正值时,即,当音频信号的级别值超过预设阈值时,增益调节量计算部136根据在级别改变度计算部134中计算的级别改变度计算音频信号的压缩比,并根据所计算的压缩比计算增益调节量。具体地,增益调节量计算部136根据以下过程(1)至(3)之一计算增益调节量。

(1)计算过程1:根据在级别改变度计算部134中计算的级别改变度计算音频信号的压缩比,并根据所计算压缩比计算增益调节量。

(2)计算过程2:根据级别改变度计算部134中计算的级别改变度计算增益调节的阈值,并根据所计算阈值计算增益调节量。

(3)计算过程3:根据级别改变度计算部134中计算的级别改变度计算增益调节的阈值及压缩比,并根据所计算阈值及压缩比计算增益调节量。

使用以上过程(1)至(3)中的哪一个由用户事先设置,或取决于所选源或再现内容来设置。以上设置基于源识别部138的识别。

源识别部138识别当前再现的音频信号的内容。在此假设音频增益调节设备110安装在数字广播电视系统中。在数字广播中,诸如内容种类的节目信息被包含在要广播的数据中,且节目信息用作电子电视节目表。源识别部138可基于这种节目信息识别当前内容的种类,并确定以上计算过程的哪一个用于增益调节。

此外,源识别部138可在一个频道或输入源切换至另一个时作出以上确定。可事先作出在哪个条件下使用以上计算过程之一的设置并可由用户来选择。例如,电影的情况下,为了音效等,信号级别经常突然改变。当在这种情况下进行增益压缩方向上的处理时,原音效可能减弱。为了解决此,在当前内容被识别为电影的情况下,不进行增益压缩处理以避免不利结果。替代地,新闻节目的情况下,假设不发生音量的显著改变,从而压缩比设置得比较高,因此防止切换到商用消息时产生的大音量带来的不适感。此外,可在电视等的遥控器上设置用于暂时停止压缩处理的按钮。

增益调节部120在从音频信号输入部112输入到其的音频信号中反映在增益调节量计算部136中计算的增益调节量,并向音频信号输出部输出所得信号。

接下来,将描述在级别改变度计算部134中进行的增益调节量的计算过程1至3。

(1)以下三个方法(a)至(c)用于计算过程1。图11至14各示出级别改变度与压缩比之间的关系。尽管为了描述性目的在图11至14中将压缩比设置为无限(∞),当然可任意地设置压缩比。

(a)如图11所示,仅当级别改变度超过预设值时,进行压缩处理,其概念与限幅器相同。当从无声状态突然形成大音量音频信号时,该方法有效。具体地,在广播期间从给定节目切换到CM(商用消息)时,仅当CM音从一秒的无声突然形成时,压缩比变为最大值,由此相对于响的音频信号减轻听众的不适感。

(b)如图12所示,压缩比与级别改变度成比例地变化。即,级别改变度越高,压缩比越高。不仅在从给定节目切换到CM时,还在给定节目或电影中的一个场景突然从一个无声场景切换到生成大音量的场景时,压缩比根据音强度增大。从而观众可更舒适地享受内容。

(c)如图13所示,压缩比根据级别改变度指数地变化。在该方法中,在正常条件下,压缩比设置成低级别,而存在极突然地生成大音量的倾向时,可指数地增大压缩比。因此,有可能仅抑制观众厌烦的音频信号,同时在正常条件下保持听觉的自然性。

(2)以下三个方法(a)至(c)用于计算过程2。图14至16各示出级别改变度与阈值之间的关系。

(a)如图14所示,仅当级别改变度超过预设值时,阈值减小。当从无声状态突然形成大音量音频信号时,该方法有效。具体地,在广播期间从给定节目切换到CM(商用消息)时,仅当CM音从一秒的无声突然形成时,阈值减小,由此相对于响的音频信号减轻听众的不适感。

(b)如图15所示,阈值与级别改变度成比例地变化。即,级别改变度越高,阈值越小。不仅在从给定节目切换到CM时,但还在给定节目或电影中的一个场景突然从一个无声场景切换到生成大音量的场景时,阈值根据音强度减小。从而观众可更舒适地享受内容。

(c)如图16所示,阈值根据级别改变度指数地变化。在该方法中,在正常条件下,阈值设置成大值,而存在极突然地生成大音量的倾向时,可指数地减小压缩比。因此,有可能仅抑制观众厌烦的音频信号,同时在正常条件下保持听觉的自然性。

(3)计算过程3是计算过程1与2的组合。

阈值与压缩比同时变化以用于控制。当阈值减小时,压缩比减小,从而使对应于最大输入的输出级别保持恒定。因此,有可能仅抑制观众厌烦的音频信号。如图17与18所示,当输入级别变得等于或高于预定值时,对应输出级别相比于常规方法减小。此外,如图19所示,当输入级别变得等于或高于预定值时,输出级别限制到特定值。

如上所述,根据当前实施例,有可能进行与人实际经历的听觉音量更匹配的增益调节。从而观众可更舒适地享受内容。要注意,上述技术可按照相反方向施加于压缩。即,诸如动作电影的内容包含例如许多动作场景,其中安静突然被大音量破坏,如爆炸场景,从而在这种内容中,可更有效地表达场景。在这种情况下,可能不是为了压缩而是为了放大音频信号而应用处理。

<第四实施例>

通过组合第三实施例与第一或第二实施例来获得本实施例。即,如同第一或第二实施例的情况,响度级别用于调节长期增益与短期增益以便允许将声音调节成听觉友好级别,同时在一定程度上确保生产商所期望的动态范围。此外,如同第三实施例的情况,增益调节方法在从一个输入源或一个场景切换到另一个时音量级别突然显著改变的情况下根据前一音频信号的音量级别的状态来改变。

图20是根据本实施例的音频增益调节设备210的功能框图,其示出第三实施例的配置简单与第一或第二实施例的配置串联连接的实施例。音频增益调节设备210所具有的配置通过在第一实施例的图1的音频增益调节设备10中,在音频信号输入部12与长期增益反映部14之间设置第三实施例的增益调节部120与增益控制器130来获得。由相同附图标记表示的组件具有与那些上述的组件相同的功能,且因此本文中省略它们的重复描述。

即使增益调节部120与增益控制器130设置在合成部40与音频信号输出部42之间,也可获得相同功能与效果。

如图20所示,有可能不只采用第三实施例的配置简单地与第一或第二实施例的配置串联连接的实施例。然而,还有可能采用第三实施例的配置集成在第一或第二实施例的计算压缩目标增益的部分中的实施例。在该情况下,可减少处理量,并且可有效地计算压缩目标增益。

图21是本实施例的变体,并示出增益调节部120与增益控制器130设置在第一实施例所描述的压缩部80的压缩目标增益计算部83中的配置。增益调节部120与增益控制器130的功能基本上与第三实施例的相同,但是不同之处在于不仅基于音频信号,还基于响度级别来进行增益调节。替代地,增益调节部120与增益控制器130可设置在第二实施例的压缩部80的压缩目标增益计算部83中。

增益控制器130包括阈值级别比较部132、增益调节量计算部136、以及源识别部138。在该配置中,省略了级别改变度计算部134,而在级别上升沿检测部88中计算的上升度用作在级别改变度计算部134中计算的级别改变度。

阈值级别比较部132比较从级别阈值比较部82获取的响度级别值与预设阈值级别以便计算差级别,并通知增益调节量计算部136所计算的差级别。

当在阈值级别比较部132中计算的差级别为正值时,即,当音频信号的响度级别值超过预设阈值时,增益调节量计算部136根据在级别上升沿检测部88中计算的级别改变度计算用于计算压缩目标增益的压缩比,并向增益调节部120输出所计算压缩比。当没有来自增益调节量计算部136的输出时,即,在阈值级别比较部132中计算的差级别为负值或零时,增益调节部120参考在级别阈值比较部82中进行的级别阈值比较处理的结果,如以上实施例,且如果必要,基于压缩阈值与当前响度级别之间的差重新计算压缩目标增益。当存在来自增益调节量计算部136的输出时,增益调节部120使用在增益调节量计算部136中计算的压缩比来替代从级别阈值比较部82输入的响度级别,以便计算压缩目标增益并向压缩增益改变宽度计算部84输出所计算的压缩目标增益。然后,源识别部138以与上述方式相同的方式来识别内容。所识别的内容信息反映在增益调节量计算部136中的压缩比计算处理中。根据以上配置与处理,增益调节方法不仅根据暂时音量级别还根据前一音频信号的音量级别的状态而改变的情况下,可使用更接近人的听觉的响度级别来执行处理。在该情况下,可反映内容的特性。

虽然,在以上示例中,增益调节部120与增益控制器130的功能包含在压缩目标增益计算部93中,但是它们可包含在级别阈值比较部82中或压缩增益改变宽度计算部84中。

附图标记说明

10,110,210:音频增益调节设备

12:音频信号输入部

14:长期增益反映部

20:分频部

22:LPF

24:HPF

26:BPF

30:短期增益反映部

32:低频反映部

34:高频反映部

36:中频反映部

40:合成部

42:音频信号输出部

50,50a:长期增益计算部

52:音频信号存储部

53:输出音压特性应用部

54:响度级别转换部

56:级别比较/计数部

58:长期增益更新部

60,60a:短期增益计算部

70,70a:放大部

71:音频信号存储部

72:响度级别转换部

73:级别阈值比较部

74:级别上升沿检测部

75:放大目标增益计算部

76:放大增益改变宽度计算部

77:输出音压特性应用部

80:压缩部

81:长期增益调节部

82:级别阈值比较部

83:压缩目标增益计算部

84:压缩增益改变宽度计算部

85:响度级别存储部

86:平均级别计算部

87:级别标准偏差计算部

88:级别上升沿检测部

90:短期增益更新部

130:增益控制器

132:阈值级别比较部

134:级别改变度计算部

136:增益调节量计算部

138:源识别部

140:长期增益反映部

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号