公开/公告号CN114979902A
专利类型发明专利
公开/公告日2022-08-30
原文格式PDF
申请/专利权人 珠海市华音电子科技有限公司;
申请/专利号CN202210580104.9
申请日2022-05-26
分类号H04R3/00(2006.01);H04R1/40(2006.01);G10L21/0208(2013.01);G10L21/0216(2013.01);
代理机构北京智鸿港知识产权代理事务所(普通合伙) 16003;
代理人张学府
地址 519031 广东省珠海市横琴新区宝华路6号105室-7240
入库时间 2023-06-19 16:31:45
法律状态公告日
法律状态信息
法律状态
2023-01-20
授权
发明专利权授予
2022-09-16
实质审查的生效 IPC(主分类):H04R 3/00 专利申请号:2022105801049 申请日:20220526
实质审查的生效
技术领域
本发明涉及降噪拾音技术领域,特别涉及一种基于改进的变步长DDCS自适应算法的降噪拾音方法。
背景技术
目前,随着声音处理技术的发展,对声音的拾音与降噪的处理技术也越来越成熟和完善,在日常生活中,在会议大厅等场所进行声音处理,从而使得每个人可以准确获取声音信息;
然而,现如今的技术中多为对声音音量的处理或者对声音噪声的处理是分开的,从而大大增加处理的复杂度,使得声音处理质量降低,造成用户体验感不足;
因此,本发明提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,通过两个振膜肩负不同特性的声音,其中一个振膜负责高音压,也就是大音量的收音,另外一个振膜则是高信噪比振膜,负责高感音效。因此,不论是音量大或是音量小,会议单元通过双振膜都会拾取到最佳的音效,当这两个振膜的讯号结合在一起后即可大幅度降低背景噪音、提升信噪比与拾音清晰度,提高用户体验感。
发明内容
本发明提供一种基于改进的变步长DDCS自适应算法的降噪拾音方法,用以通过第一振膜与第二振膜对会议声音进行处理,有利于大幅度降低背景噪音、提升信噪比与拾音清晰度,提高用户体验感。。
一种基于改进的变步长DDCS自适应算法的降噪拾音方法,包括:
步骤1:确定目标拾音单元中的第一振膜与第二振膜;
步骤2:基于所述第一振膜与所述第二振膜收集会议声音,并确定所述会议声音的变化特征;
步骤3:基于所述会议声音的变化特征并根据预设算法自适应调整所述第一振膜与所述第二振膜的音频信号处理步长,并基于自适应调整结果实现对所述会议声音的降噪拾音处理。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤1中,包括:
所述第一振膜用于对音频信号中的大音量进行收音;
所述第二振膜用于提高所述音频信号的信噪比。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤2中,基于所述第一振膜与所述第二振膜收集声音信息之前,还包括:
基于预设声音收集终端对会议场所进行收音操作,并获得音频数据;
读取所述音频数据,确定所述音频数据中的音色信息,并将所述音色信息输入至预设音色识别模型中进行音色识别,并基于音色识别结果确定所述音频数据中的人员声音数据;
其中,所述人员声音信息数据属于所述音频数据;
将所述人员声音数据在所述音频数据进行分离,获得第一音频数据、第二音频数据;
基于所述第一音频数据确定目标声音,同时,将所述目标声音输入至所述第一振膜与所述第二振膜中进行声音收集;
将所述第二音频数据进行打包处理,并获得第二音频数据包,同时,将所述第二音频数据包进行删除。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤2中,确定会议声音的变化特征,包括:
读取收集到的所述会议声音,确定所述会议声音的音频帧段,并根据设定区间截取所述会议声音的音频帧段,获取多个子音频帧段;
分别读取所述多个子音频帧段中每个音频帧的帧音量,并将每个音频帧的帧音量与预设音量区间进行比较,获得比较结果;
基于所述比较结果确定所述每个音频帧的帧音量属于的目标音量区间,获得第一音量信息;
基于所述每个音频帧的帧音量属于的目标音量区间确定所述每个子音频帧段的平均音量信息,并将所述平均音量信息作为第二音量信息;
对所述第二音量信息进行分析,确定每个子音频帧段的音量特征,并根据每个子音频帧段的音量特征确定所述会议声音的平均音量信息,并将所述平均音量信息作为第三音量信息;
对所述第一音量信息、第二音量信息以及所述第三音量信息进行分析,确定所述会议声音的音量变化特征信息;
将所述会议声音的音量变化特征信息输入至所述第一振膜。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤2中,确定所述会议声音的变化特征,还包括:
读取所述会议声音,确定所述会议声音中的声音信号,同时,提取所述声音信号的信号频率以及信号幅度;
根据所述声音信号的信号频率以及信号幅度确定所述声音信号的波动特征,同时,基于所述声音信号的波动特征确定所述声音信号的声音频率分量;
基于所述声音频率分量对所述会议声音中的声音信号进行信号抑制处理,并基于处理结果确定所述会议声音的声音信号中的噪音频率分量;
基于所述声音频率分量与所述噪声频率分量确定所述会议声音的信噪变化特征信息;
将所述会议声音的信噪变化特征信息输入至所述第二振膜。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤3中,包括:
读取所述会议声音的变化特征,确定所述会议声音的音量变化特征信息以及所述会议声音的信噪变化特征信息;
基于所述会议声音的音量变化特征信息匹配第一预设算法自适应调整所述第一振膜的音频信号处理步长,获得第一自适应调整处理结果;
基于所述会议声音的信噪变化特征信息匹配第二预设算法自适应调整所述第二振膜的音频信号处理步长,获得第二自适应调整处理结果;
将所述第一自适应调整处理结果与所述第二自适应调整处理结果进行结合完成对所述会议声音的降噪拾音处理。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,基于所述会议声音的音量变化特征信息匹配第一预设算法自适应调整所述第一振膜的音频信号处理步长,获得第一自适应调整处理结果,具体包括:
获取会议场所的空间大小,同时,确定所述会议场所的布置特征;
基于所述会议场所的空间大小确定会议声音的第一音量反射系数,同时,根据所述会议场所的布置特征确定所述会议声音的第二音量反射系数;
将所述第一音量反射系数输入至预设数据库中进行第一匹配,并基于第一匹配结果确定所述第一音量反射系数所对应的音量最优区间;
将所述第二音量反射系数在所述音量最优区间中进行第二匹配,并基于所述第二匹配结果确定在所述会议场所中输出的最佳音量;
读取所述会议声音的音量变化特征信息,并基于所述音量变化特征信息确定所述会议声音的动态输出音量;
将所述动态输出音量与所述最佳音量进行动态比较,并获得比较结果;
在所述比较结果中提取动态输出音量低于所述最佳音量的第一目标音量,并确定所述第一目标音量与所述最佳音量的第一动态差量;
基于所述第一振膜中调取所述第一预设算法并根据所述第一动态差量自适应增大步长调整所述第一目标音量至所述最佳音量,获得第一音量步长处理结果;
在所述比较结果中提取动态输出音量高于所述最佳音量的第二目标音量,并确定所述第二目标音量与所述最佳音量的第二动态差量;
基于所述第一振膜中调取所述第一预设算法并根据所述第二动态差量自适应减小步长调整所述第二目标音量至所述最佳音量,获得第二音量步长处理结果;
基于所述第一音量步长处理结果与所述第一音量步长处理结果获得所述获得第一自适应调整处理结果。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,基于所述会议声音的信噪变化特征信息匹配第二预设算法自适应调整所述第二振膜的音频信号处理步长,获得第二自适应调整处理结果,具体包括:
读取所述会议声音的信噪变化特征信息,并基于所述信噪变化特征信息匹配所述第二预设算法,并确定所述第二预设算法的计算因子;
基于所述会议声音的信噪变化特征信息确定所述会议声音的动态信噪比,并根据所述动态信噪比确定所述会议声音信噪特征的分散程度;
根据所述会议声音信噪特征的分散程度以及所述计算因子,确定在所述第二振膜中的自适应步长调节因子;
根据所述自适应步长调节因子的变化状态确定对所述会议声音的音频信号进行调节的动态步长,并基于所述动态步长自适应调节所述会议声音的信噪比,并获得所述第二自适应调整处理结果。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤3中,并基于自适应调整结果实现对所述会议声音的降噪拾音处理后,还包括:
获取所述会议声音的拾音清晰度,同时,确定所述会议声音的信噪比;
将所述会议声音的拾音清晰度与清晰度阈值进行第一比较,判断所述第一振膜是否达到对所述会议声音的拾音处理标准;
其中,当所述会议声音的拾音清晰度大于或等于所述清晰度阈值时,则判定所述第一振膜达到对所述会议声音的拾音处理标准;
否则,则判定所述第一振膜没有达到对所述会议声音的拾音处理标准;
将所述会议声音的信噪比与信噪比阈值进行第二比较,判断所述第二振膜是否达到对所述会议声音的降噪处理标准;
其中,当所述会议声音的信噪比大于或等于信噪比阈值时,则判定所述第二振膜达到对所述会议声音的降噪处理标准;
否则,则判定所述第二振膜没有达到对所述会议声音的降噪处理标准。
优选的,一种基于改进的变步长DDCS自适应算法的降噪拾音方法,还包括:
当所述第一振膜没有达到对所述会议声音的拾音处理标准时,进行第一报警操作,同时,基于所述清晰度阈值以及所述会议声音的拾音清晰度之间的目标差值生成第一优化因子,并基于所述第一优化因子对所述预设算法进行第一优化;
当所述第二振膜没有达到对所述会议声音的降噪处理标准时,进行第二报警操作,同时,基于所述信噪比阈值以及所述会议声音的信噪比之间的目标差值生成第二优化因子,并基于所述第二优化因子对所述预设算法进行第二优化。
优选的,对所述会议声音的降噪拾音处理之前,还包括:
获取会议场所中麦克风的布置位置以及麦克风的个数,分别确定声源到达每个麦克风的距离;
基于声源到达麦克风的距离,并以第一个麦克风拾取的语音信号为基准,构建所述声源到达每个麦克风时拾取信号的延时函数;
其中,τ(m)表示声源到达每个麦克风时拾取信号的延时函数;r(m)表示声源到达第m个麦克风的距离;δ表示常数,取值为2;m表示当前麦克风,且取值范围为(0,n),n≥2;d相邻麦克风之间的平均距离;θ
基于所述声源到达每个麦克风时拾取信号的延时函数计算在所述会议场所中,所述声源中的噪声信号混叠输出;
其中,x(n)表示所述声源中的噪声信号混叠输出;n表示所述声源的声音信号;h(n)表示所述声源在在所述会议场所的单位冲击响应;μ表示所述会议场所的平均吸声系数;p表示所述声源在会议场所的当前条反射路径;k表示所述声源在会议场所的总反射路径;a
基于所述声源中的噪声信号混叠输出,确定对所述会议声音的降噪拾音处理的处理标准;
当基于所述第一振膜与所述第二振膜对会议声音进行降噪处理的处理结果达到对所述会议声音的降噪拾音处理的处理标准,则完成对所述对所述会议声音的降噪拾音处理;
否则,继续对所述会议声音进行降噪拾音处理,直至达到所述处理标准
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于改进的变步长DDCS自适应算法的降噪拾音方法流程图;
图2为本发明实施例中一种基于改进的变步长DDCS自适应算法的降噪拾音方法中步骤2的流程图;
图3为本发明实施例中一种基于改进的变步长DDCS自适应算法的降噪拾音方法中步骤3的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,如图1所示,包括:
步骤1:确定目标拾音单元中的第一振膜与第二振膜;
步骤2:基于所述第一振膜与所述第二振膜收集会议声音,并确定所述会议声音的变化特征;
步骤3:基于所述会议声音的变化特征并根据预设算法自适应调整所述第一振膜与所述第二振膜的音频信号处理步长,并基于自适应调整结果实现对所述会议声音的降噪拾音处理。
该实施例中,第一振膜用于对音频信号中的大音量进行收音;第二振膜用于对提高所述音频信号的信噪比。
该实施例中,会议声音的变化特征包括:会议声音的音量变化特征、会议声音的信噪变化特征。
该实施例中,预设算法可以是变步长DDCS自适应算法。
该实施例中,会议系统拾音单元上有两个振膜,这两个振膜肩负不同特性的声音,其中一个振膜负责高音压,也就是大音量的收音,另外一个振膜则是高信噪比振膜,负责高感音效。因此,不论是音量大或是音量小,会议单元通过双振膜都会拾取到最佳的音效,当这两个振膜的讯号结合在一起后即可大幅度降低背景噪音、提升信噪比与拾音清晰度。
上述技术方案的有益效果是:通过第一振膜与第二振膜对会议声音进行处理,有利于大幅度降低背景噪音、提升信噪比与拾音清晰度,提高用户体验感。
实施例2:
在实施例1的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,如图2所示,步骤2中,基于所述第一振膜与所述第二振膜收集声音信息之前,还包括:
S201:基于预设声音收集终端对会议场所进行收音操作,并获得音频数据;
S202:读取所述音频数据,确定所述音频数据中的音色信息,并将所述音色信息输入至预设音色识别模型中进行音色识别,并基于音色识别结果确定所述音频数据中的人员声音数据;
其中,所述人员声音信息数据属于所述音频数据;
S203:将所述人员声音数据在所述音频数据进行分离,获得第一音频数据、第二音频数据;
S204:基于所述第一音频数据确定目标声音,同时,将所述目标声音输入至所述第一振膜与所述第二振膜中进行声音收集;
S205:将所述第二音频数据进行打包处理,并获得第二音频数据包,同时,将所述第二音频数据包进行删除。
该实施例中,预设声音收集终端可以是在声音进入到第一振膜与第二振膜之前的声音收集装置,用来对会议场所进行收音操作。
该实施例中,预设音色识别模型可以是用来对音色进行识别的模型,是提前训练好的模型,可通过大数据等方式训练完成。
该实施例中,音色信息可以是包含人员音色信息以及非人员音色信息(如:倒水声,风声等音色)。
该实施例中,第一音频数据可以是人员声音数据,第二音频数据可以是除人员声音数据以外的声音数据。
上述技术方案的有益效果是:通过预设声音收集终端对会议声音进行收音,并识别会议声音中的人员声音以及非人员声音,从而对非人员声音数据(第二音频数据)进行剔除,从而提高了第一振膜与第二振膜对会议声音的处理效率,有利于使得拾音降噪更加精准。
实施例3:
在实施例1的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤2中,确定会议声音的变化特征,包括:
读取收集到的所述会议声音,确定所述会议声音的音频帧段,并根据设定区间截取所述会议声音的音频帧段,获取多个子音频帧段;
分别读取所述多个子音频帧段中每个音频帧的帧音量,并将每个音频帧的帧音量与预设音量区间进行比较,获得比较结果;
基于所述比较结果确定所述每个音频帧的帧音量属于的目标音量区间,获得第一音量信息;
基于所述每个音频帧的帧音量属于的目标音量区间确定所述每个子音频帧段的平均音量信息,并将所述平均音量信息作为第二音量信息;
对所述第二音量信息进行分析,确定每个子音频帧段的音量特征,并根据每个子音频帧段的音量特征确定所述会议声音的平均音量信息,并将所述平均音量信息作为第三音量信息;
对所述第一音量信息、第二音量信息以及所述第三音量信息进行分析,确定所述会议声音的音量变化特征信息;
将所述会议声音的音量变化特征信息输入至所述第一振膜。
该实施例中,设定区间可以是根据时间段确定的,即每5秒截取一个音频帧段作为子音频帧段。
该实施例中,预设音量区间可以是提前设定好的,比如1-10分贝为一个音量区间,11-20分贝为一个音量区间。
该实施例中,第一音量信息可以是在一个子音频帧段中每一个音频帧的帧音量对应的音量区间分布情况。
该实施例中,第二音量信息可以是基于在当前个子音频帧段中每一个音频帧的帧音量对应的音量区间分分布情况,从而确定当前个子音频帧段的平均音量信息。
该实施例中,第三音量信息可以是基于每个子音频帧段的平均音量信息确定会议声音的平均音量信息。
上述技术方案的有益效果是:通过确定第一音量信息、第二音量信息以及第三音量信息并进行音量分析,从而确定会议声音的音量变化特征信息,提高了音量分析的精准性以及客观性,从而有利于第一振膜对会议声音高音压处理。
实施例4:
在实施例1的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤2中,确定所述会议声音的变化特征,还包括:
读取所述会议声音,确定所述会议声音中的声音信号,同时,提取所述声音信号的信号频率以及信号幅度;
根据所述声音信号的信号频率以及信号幅度确定所述声音信号的波动特征,同时,基于所述声音信号的波动特征确定所述声音信号的声音频率分量;
基于所述声音频率分量对所述会议声音中的声音信号进行信号抑制处理,并基于处理结果确定所述会议声音的声音信号中的噪音频率分量;
基于所述声音频率分量与所述噪声频率分量确定所述会议声音的信噪变化特征信息;
将所述会议声音的信噪变化特征信息输入至所述第二振膜。
该实施例中,波动特征可以是声音信号的信号频率以及信号幅度确定的特征,用来对声音信号进行分析的,确定声音频率分量以及噪音频率分量的。
上述技术方案的有益效果是:通过确定声音信号的波动特征,从而有利于在会议声音中的声音信号中分离出声音频率分量以及噪音频率分量,从而确定会议声音的信噪变化特征。
实施例5:
在实施例1的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音算法,如图3所示,步骤3中,包括:
S301:读取所述会议声音的变化特征,确定所述会议声音的音量变化特征信息以及所述会议声音的信噪变化特征信息;
S302:基于所述会议声音的音量变化特征信息匹配第一预设算法自适应调整所述第一振膜的音频信号处理步长,获得第一自适应调整处理结果;
S303:基于所述会议声音的信噪变化特征信息匹配第二预设算法自适应调整所述第二振膜的音频信号处理步长,获得第二自适应调整处理结果;
S304:将所述第一自适应调整处理结果与所述第二自适应调整处理结果进行结合完成对所述会议声音的降噪拾音处理。
该实施例中,第一预设算法可以是基于DDCS算法对会议声音的音量的步长进行自适应调整的算法。
该实施例中,第二预设算法可以是基于DDCS算法对会议声音中的信噪比的步长进行自适应调整的算法。
上述技术方案的有益效果是:通过音量变化特征信息匹配对应的第一预设算法以及信噪变化特征信息匹配第二预设算法,从而有利于对会议声音的大音量的收音以及高感度音效的实现。
实施例6:
在实施例5的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,基于所述会议声音的音量变化特征信息匹配第一预设算法自适应调整所述第一振膜的音频信号处理步长,获得第一自适应调整处理结果,具体包括:
获取会议场所的空间大小,同时,确定所述会议场所的布置特征;
基于所述会议场所的空间大小确定会议声音的第一音量反射系数,同时,根据所述会议场所的布置特征确定所述会议声音的第二音量反射系数;
将所述第一音量反射系数输入至预设数据库中进行第一匹配,并基于第一匹配结果确定所述第一音量反射系数所对应的音量最优区间;
将所述第二音量反射系数在所述音量最优区间中进行第二匹配,并基于所述第二匹配结果确定在所述会议场所中输出的最佳音量;
读取所述会议声音的音量变化特征信息,并基于所述音量变化特征信息确定所述会议声音的动态输出音量;
将所述动态输出音量与所述最佳音量进行动态比较,并获得比较结果;
在所述比较结果中提取动态输出音量低于所述最佳音量的第一目标音量,并确定所述第一目标音量与所述最佳音量的第一动态差量;
基于所述第一振膜中调取所述第一预设算法并根据所述第一动态差量自适应增大步长调整所述第一目标音量至所述最佳音量,获得第一音量步长处理结果;
在所述比较结果中提取动态输出音量高于所述最佳音量的第二目标音量,并确定所述第二目标音量与所述最佳音量的第二动态差量;
基于所述第一振膜中调取所述第一预设算法并根据所述第二动态差量自适应减小步长调整所述第二目标音量至所述最佳音量,获得第二音量步长处理结果;
基于所述第一音量步长处理结果与所述第一音量步长处理结果获得所述获得第一自适应调整处理结果。
该实施例中,会议场所的布置特征可以是会议场所中麦克风的布置,会议声音的声源发出位置以及会议场所中桌椅的摆放,因为会议场所的布置特征会影响到声音公开的音量效果。
该实施例中,第一音量反射系数可以是通过会议场所的空间大小确定声音在发出时,碰到墙壁后的反射系数。
该实施例中,第二音量反射系数可以是根据会议场所的布置特征确定的。
该实施例中,预设数据库中是提前获取的,且预设数据库中包括不同空间中声音的最佳分贝值。
该实施例中,最佳音量可以是在该会议场所中,体验感最舒服的音量分贝。
该实施例中,动态输出音量可以是基于会议场所中基于音量变化特征信息确定的音量分贝的变化。
该实施例中,第一目标音量可以是动态输出音量低于最佳音量的音量分贝值,且第一动态差量=最佳音量-第一目标音量。
该实施例中,第二目标音量可以是动态输出音量高于最佳音量的音量分贝值,且第二动态差量=第二目标音量-最佳音量。
上述技术方案的有益效果是:通过对会议场所的空间大小以及布置特征进行分析确定会议场所中体验感最好的最佳音量,通过确定会议场所中的会议声音的动态输出音量,并与最佳音量进行比较,在第一振膜中通过第一预设算法增大或减少步长,从而自适应调整会议场所中会议声音的音量一直维持在最佳音量,从而实现了对会议声音的音压控制,提高用户的体验感。
实施例7:
在实施例5的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音算法,基于所述会议声音的信噪变化特征信息匹配第二预设算法自适应调整所述第二振膜的音频信号处理步长,获得第二自适应调整处理结果,具体包括:
读取所述会议声音的信噪变化特征信息,并基于所述信噪变化特征信息匹配所述第二预设算法,并确定所述第二预设算法的计算因子;
基于所述会议声音的信噪变化特征信息确定所述会议声音的动态信噪比,并根据所述动态信噪比确定所述会议声音信噪特征的分散程度;
根据所述会议声音信噪特征的分散程度以及所述计算因子,确定在所述第二振膜中的自适应步长调节因子;
根据所述自适应步长调节因子的变化状态确定对所述会议声音的音频信号进行调节的动态步长,并基于所述动态步长自适应调节所述会议声音的信噪比,并获得所述第二自适应调整处理结果。
该实施例中,计算因子可以是第二预设算法中对会议声音进行噪声信号处理的范围,即第二预设算法的值域,当超过第二预设算法的值域则会导致处理后的声音信号失真。
该实施例中,会议声音信噪特征的分散程度可以是会议声音中声音信号与噪声信号的分离程度,是通过动态信噪比确定的,且当动态信噪比越大,则声音信号与噪声信号分离越小,则调节的步长越短,当动态信噪比越小,则声音信号与噪声信号的分离越大,则调节的步长越长。
该实施例中,自适应步长调节因子可以是用来对会议声音的信噪比进行步长调节的因子,用来确定对会议声音的音频信号进行调节的动态步长。
上述技术方案的有益效果是:通过对会议声音的信噪变化特征信息进行分析,进而确定自适应步长调节因子,因此,可以准确实现对会议声音的信噪比调节,进而大幅度降低背景噪音。
实施例8:
在实施例1的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,步骤3中,并基于自适应调整结果实现对所述会议声音的降噪拾音处理后,还包括:
获取所述会议声音的拾音清晰度,同时,确定所述会议声音的信噪比;
将所述会议声音的拾音清晰度与清晰度阈值进行第一比较,判断所述第一振膜是否达到对所述会议声音的拾音处理标准;
其中,当所述会议声音的拾音清晰度大于或等于所述清晰度阈值时,则判定所述第一振膜达到对所述会议声音的拾音处理标准;
否则,则判定所述第一振膜没有达到对所述会议声音的拾音处理标准;
将所述会议声音的信噪比与信噪比阈值进行第二比较,判断所述第二振膜是否达到对所述会议声音的降噪处理标准;
其中,当所述会议声音的信噪比大于或等于信噪比阈值时,则判定所述第二振膜达到对所述会议声音的降噪处理标准;
否则,则判定所述第二振膜没有达到对所述会议声音的降噪处理标准。
该实施例中,清晰度阈值可以是提前设定的,是根据会议场所中的最佳音量确定的,用来衡量第一振膜是否达到对会议声音的降噪处理标准。
该实施例中,信噪比阈值可以是提前设定好的,用来衡量第二振膜是否达到对会议声音的降噪处理标准。
上述技术方案的有益效果是:通过分别与清晰度阈值以及信噪比阈值进行比较,有利于衡量第一振膜与第二振膜的处理情况,进而实现第一振膜以及第二振膜中预设算法对会议声音进行处理的能力的掌握。
实施例9:
在实施例8的基础上,本实施例提供了一种基于改进的变步长DDCS自适应算法的降噪拾音方法,还包括:
当所述第一振膜没有达到对所述会议声音的拾音处理标准时,进行第一报警操作,同时,基于所述清晰度阈值以及所述会议声音的拾音清晰度之间的目标差值生成第一优化因子,并基于所述第一优化因子对所述预设算法进行第一优化;
当所述第二振膜没有达到对所述会议声音的降噪处理标准时,进行第二报警操作,同时,基于所述信噪比阈值以及所述会议声音的信噪比之间的目标差值生成第二优化因子,并基于所述第二优化因子对所述预设算法进行第二优化。
该实施例中,第一报警操作可以是与移动终端进行短信提醒。
该实施例中,第二报警操作可以是振动提醒。
该实施例中,第一优化因子可以是基于清晰度阈值以及所述会议声音的拾音清晰度之间的目标差值确定的。
该实施例中,第二优化因子可以是基于信噪比阈值以及会议声音的信噪比之间的目标差值确定的。
上述技术方案的有益效果是:通过第一报警操作以及第二报警操作可以实时了解第一振膜与第二振膜对会议声音进行处理是否达到拾音处理标准与降噪处理标准,进而通过第一优化因子与第二优化因子对预设算法进行优化,提高了第一振膜与第二振膜的会议声音的处理效率。
实施例10:
在实施例1的基础上,所述步骤3,还包括:
对所述会议声音的降噪拾音处理之前,还包括:
获取会议场所中麦克风的布置位置以及麦克风的个数,分别确定声源到达每个麦克风的距离;
基于声源到达麦克风的距离,并以第一个麦克风拾取的语音信号为基准,构建所述声源到达每个麦克风时拾取信号的延时函数;
其中,τ(m)表示声源到达每个麦克风时拾取信号的延时函数;r(m)表示声源到达第m个麦克风的距离;δ表示常数,取值为2;m表示当前麦克风,且取值范围为(0,n),n≥2;d相邻麦克风之间的平均距离;θ
基于所述声源到达每个麦克风时拾取信号的延时函数计算在所述会议场所中,所述声源中的噪声信号混叠输出;
其中,x(n)表示所述声源中的噪声信号混叠输出;n表示所述声源的声音信号;h(n)表示所述声源在在所述会议场所的单位冲击响应;μ表示所述会议场所的平均吸声系数;p表示所述声源在会议场所的当前条反射路径;k表示所述声源在会议场所的总反射路径;a
基于所述声源中的噪声信号混叠输出,确定对所述会议声音的降噪拾音处理的处理标准;
当基于所述第一振膜与所述第二振膜对会议声音进行降噪处理的处理结果达到对所述会议声音的降噪拾音处理的处理标准,则完成对所述对所述会议声音的降噪拾音处理;
否则,继续对所述会议声音进行降噪拾音处理,直至达到所述处理标准。
该实施例中,降噪拾音处理的处理标准可以是衡量第一振膜与第二振膜是否完成会会议声音的处理。
上述技术方案的有益效果是:通过建立声源到达每个麦克风时拾取信号的延时函数,从而确定声源中的噪声信号混叠输出,进而可以知道在会议场所中会议声音的声音状况,确定达到对会议声音进行降噪拾音处理的处理标准,从而提高了对会议声音进行降噪拾音处理的精度,提升用户体验感。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
机译: NLMS一种使用频率域NLMS算法优化自适应滤波器步长的方法及其装置
机译: NLMS一种使用频率域NLMS算法优化自适应滤波器步长的方法及其装置
机译: 使用具有时变步长的时变算法消除回声信号的装置和方法