公开/公告号CN102509546A
专利类型发明专利
公开/公告日2012-06-20
原文格式PDF
申请/专利权人 北京声迅电子股份有限公司;
申请/专利号CN201110359005.X
发明设计人 谭政;
申请日2011-11-11
分类号G10L15/02;G10L15/14;G10L19/00;
代理机构北京路浩知识产权代理有限公司;
代理人王莹
地址 100085 北京市海淀区上地七街1号汇众大厦1号楼五层
入库时间 2023-12-18 05:38:43
法律状态公告日
法律状态信息
法律状态
2013-07-10
授权
授权
2012-07-18
实质审查的生效 IPC(主分类):G10L15/02 申请日:20111111
实质审查的生效
2012-06-20
公开
公开
技术领域
本发明涉及语音识别技术领域,具体涉及一种应用于轨道交通的 降噪和异常声音检测方法。
背景技术
随着轨道交通的快速发展,轨道交通已经成为城市居民日常出行 的重要交通工具,轨道交通的乘换人次多,客流量大,这已经成为目 前轨道交通安全运营的一大问题。随后引入的视频监控系统,在一定 程度上为运营部门提供了较全面的现场监控信息,通过这些信息,运 营部门可以实时了解轨道站内的安全情况。由于这些监控系统都不具 备音频监控功能,因此对于一些特殊的事件,仅凭视频监控却无能为 力了,例如突发的围观事件、爆炸事件、呼喊、呼救等。
语音识别技术从兴起到现阶段已经取得了很多丰硕成果,这为我 们从异常声音识别上识别尖叫、呼救、爆炸等突发事件提供了理论依 据。近年来,音频监听功能的作用不断受到重视,用户对监控系统提 出了更高的要求,既要能“看得见”,又要能“听得清”。由于环境噪 声的影响,音频监听往往难以达到好的听觉效果,为了做到“听得清”, 亟需设计一种有效的降噪和异常声音检测方法。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题是:如何提供一种能有效抑制监控轨 道交通监听范围内的声音信号中的噪声成分,同时能方便地检测轨道 交通监听范围内异常声音的方法。
(二)技术方案
为解决上述技术问题,本发明提供了一种应用于轨道交通的降噪 和异常声音检测方法,包括以下步骤:
S1、采集轨道交通监测区域范围内的声音信号;
S2、将所述声音信号从模拟信号转化成数字信号;
S3、提取所述数字信号的特征值,根据所述特征值判断所述声音 信号是否为异常声音信号;
S4、通过构造滤波器,利用所述滤波器对步骤S2输出的声音信号 做降噪处理,并输出处理后的声音信号。
优选地,步骤S4中构造滤波器的步骤包括:
S41、对步骤S2输出的数字信号做加窗处理;
S42、利用傅里叶变换对加窗后的信号做幅频变换处理;
S43、根据傅里叶变换系数统计加窗后的信号帧的能量信息;
S44、计算所述信号帧的先验信噪比;
S45、利用所述能量信息和先验信噪比构造滤波器。
优选地,步骤S41中做加窗处理时所用的窗函数为变形的海明窗, 构造所述窗函数的具体过程为:首先,求L+1个点的海明窗,然后对 每个点求平方值;其次,求L+1个点的海明窗的各点平方和;最后, 用求得的平方和对各平方值做归一化,取前L个归一化值作为变形的 海明窗的值。
优选地,在所述步骤S1之前还包括步骤:生成轨道交通监测区 域范围内的一定数量的声音信号样本库,然后提取所述样本库中各声 音信号的特征值,根据各声音信号的特征值形成特征向量,再对所形 成的特征向量进行聚类操作,生成样本库特征模型。
优选地,所述聚类操作具体为:利用高斯混合模型或隐马尔科夫 模型进行建模。
优选地,步骤S3中根据所述特征值判断所述声音信号是否为异常 声音信号的步骤具体为:计算所述数字信号的特征值与所述样本库特 征模型中的正常声音特征向量和异常声音特征向量各自的欧氏空间 距离,所得距离值最小的,认为所提取的数字信号与该样本库中对应 的声音类型相同,从而判断所采集的信号是否为异常声音信号。
优选地,所述特征值为短时过零率、短时能量,信号能量与信号 频率分布关系,能量梯度值以及梅尔倒谱系数中的任一种或者几种的 组合。
(三)有益效果
本发明利用语音识别技术设计了一种能有效抑制监控轨道交通 监听范围内的声音信号中的噪声成分,同时能方便地检测轨道交通监 听范围内异常声音的方法。本发明不仅将语音识别技术成功引入到安 防监控领域,能够在一定程度上提高轨道运营人员对突发事件的响应 速度,而且有效的将语音增强技术引用到了安防监控领域,利用所构 造的滤波器进行降噪能够明显的抑制语音信号中的噪声成分,进而有 效地改善了音频监听效果。
附图说明
图1是本发明实施例的方法流程图;
图2是本发明中降噪方法实施的流程图。
具体实施方式
下面对于本发明所提出的一种应用于轨道交通的降噪和异常声 音检测方法,结合附图和实施例详细说明。
如图1、2所示,为本发明实施例的方法流程图,该方法包括以下 步骤:
S0、生成轨道交通监测区域范围内的一定数量的声音信号样本 库,然后提取所述样本库中各声音信号的特征值,根据各声音信号的 特征值形成特征向量,再对所形成的特征向量进行聚类操作,生成样 本库特征模型。所述聚类操作具体为:利用高斯混合模型(Gaussian Mixture Model,GMM)进行建模,也可以采用其它模型进行建模, 如隐马尔科夫模型(HMM);
S1、采集轨道交通监测区域范围内的声音信号,所述范围的大小 由所使用的声音采集设备能够采集的范围来决定;
S2、将所述声音信号从模拟信号转化成数字信号;
S3、提取所述数字信号的特征值,计算所述数字信号的特征值与 所述样本库特征模型间的欧氏空间距离,具体而言,通过计算所提取 数字信号的特征值与样本库特征模型中的正常声音特征向量和异常 声音特征向量各自的欧氏空间距离,所得距离值最小的,我们认为所 提取的数字信号与该样本库的对应声音的类型相同,从而判断所采集 的信号是否为异常声音;
S4、通过构造滤波器,利用所述滤波器对所述的语音信号做降噪 处理,并输出干净语音信号。
步骤S4中构造滤波器的步骤包括:
S41、对步骤S2输出的数字信号做加窗处理,所用的窗函数为变 形的海明窗,构造窗函数的具体过程是:首先,求L+1个点的海明窗, 然后对每个点求平方值;其次,求L+1个点的海明窗的各点平方和; 最后,用求得的平方和对各平方值做归一化,取前L个归一化值作为 变形的海明窗的值。实验表明,这样构造窗函数在一定程度上能够提 高噪声谱估计的准确度,从而能够有效提高滤波器的滤波性能;
S42、利用傅里叶变换对加窗后的信号做幅频变换处理;
S43、根据傅里叶变换系数统计加窗后的信号帧的能量信息;
S44、计算所述信号帧的先验信噪比;
S45、利用所述能量信息和先验信噪比构造滤波器,利用所述能 量信息和先验信噪比构造滤波器的方法为现有技术。用步骤S45输出 的滤波器对S2输出的数字音频信号做降噪处理,输出的音频信号就是 降噪后的目标信号。
本发明的优点是将语音识别技术成功引入到安防监控领域,能够 在一定程度上解决智能视频监控系统监控轨道交通中异常声音事件 和音频降噪难的问题。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关 技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下, 还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明 的范畴,本发明的专利保护范围应由权利要求限定。
机译: 声音异常检测装置,异常模型学习装置,异常声音检测装置,声音异常检测方法,声音异常产生装置,数据异常产生装置,声音异常产生方法以及程序
机译: 异常声音检测装置,异常模型学习设备,异常检测装置,异常声音检测方法,异常声音产生装置,异常数据生成装置,异常声音生成方法和程序
机译: 异常声音检测设备,异常模型学习设备,异常检测装置,异常声音检测方法,异常声音产生装置,异常数据生成装置,异常的声音发电方法和程序