您现在的位置：首页> 研究主题> MFCC

MFCC

MFCC的相关文献在1999年到2022年内共计341篇，主要集中在自动化技术、计算机技术、无线电电子学、电信技术、物理学等领域，其中期刊论文247篇、会议论文6篇、专利文献88篇；相关期刊163种，包括人天科学研究、科技信息、弹箭与制导学报等；相关会议6种，包括2010国际仪器仪表与测控技术大会、第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议（第一届全国和谐人机环境联合学术大会）、中国声学学会2005年青年学术会议[CYCA'05]等；MFCC的相关文献由872位作者贡献，包括刘传银、梁庆真、刘浩等。

MFCC—发文量

期刊论文>

论文：247篇占比：72.43%

会议论文>

论文：6篇占比：1.76%

专利文献>

论文：88篇占比：25.81%

总计：341篇

MFCC—发文趋势图

MFCC
-研究学者

刘传银
梁庆真
刘浩
张浩
罗挺
高小清
于慧伶
刘贤洪
张永皋
李坤
李敬兆
杜庆治
王婧
苏健民
邵玉斌
霍春宝
龙华
丁一珊
万潇
乔欣
乔飞
于洪志
仇洪冰
任杰
何朝霞
冯宇红
刘付喜
刘加
刘年
刘思思
刘敬凤
刘晨
刘辛军
刘雅琴
华晶
单伟伟
史亚光
史治国
吴蔚澜
周后盘
周杨
周涛
周萍
周陬
唐永锋
夏善红
孟祥斌
孟脦崴
宋宏健
宋浠瑜

MFCC
-相关主题

MFCC
-相关期刊

MFCC
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2022
(36)
2021
(17)
2020
(11)
2019
(12)
2018
(11)
2017
(16)
2016
(15)
2015
(13)
2014
(16)
2013
(17)
2012
(11)
2011
(11)
2010
(11)
2009
(24)
2008
(22)
2007
(15)
2006
(4)
2005
(5)
2004
(4)
2003
(2)
2002
(3)
2001
(1)
1999
(1)

期刊

收录数据库

作者

刘传银
(5)
梁庆真
(5)
刘浩
(4)
张浩
(4)
罗挺
(4)
高小清
(4)
于慧伶
(3)
刘贤洪
(3)
张永皋
(3)
李坤
(3)
李敬兆
(3)
杜庆治
(3)
王婧
(3)
苏健民
(3)
邵玉斌
(3)
霍春宝
(3)
龙华
(3)
丁一珊
(2)
万潇
(2)
乔欣
(2)
乔飞
(2)
于洪志
(2)
仇洪冰
(2)
任杰
(2)
何朝霞
(2)
冯宇红
(2)
刘付喜
(2)
刘加
(2)
刘年
(2)
刘思思
(2)
刘敬凤
(2)
刘晨
(2)
刘辛军
(2)
刘雅琴
(2)
华晶
(2)
单伟伟
(2)
史亚光
(2)
史治国
(2)
吴蔚澜
(2)
周后盘
(2)
周杨
(2)
周涛
(2)
周萍
(2)
周陬
(2)
唐永锋
(2)
夏善红
(2)
孟祥斌
(2)
孟脦崴
(2)
宋宏健
(2)
宋浠瑜
(2)

关键词

申请/权力人

;

1. 多任务学习在中国方言分类中的应用研究
- 万苗；任杰；马苗；曹瑞
- 摘要：近年来,随着深度学习技术在语音识别领域的出色表现,基于深度学习的语音识别系统被广泛应用于智能家居、智能客服、会议纪要、实时字幕等多个应用场景。但由于中国民族众多,语言文化差异大、方言多样复杂等特点,给语音识别系统带来了很大的挑战,特别针对短时语音段方言识别任务,已有的中国方言分类系统性能依然较差。针对特征参数梅尔倒谱系数(mel-scale frequency cepstral coefficients,MFCC)进行研究分析,面向中国十种方言数据集构建基于深度学习的方言分类模型。首先,针对MFCC构建基于短期记忆网络(long short-term memory,LSTM)的单任务学习模型,准确率可达79.04%;然后,深入挖掘方言地域特征,提出以方言所在区域为辅助任务的多任务模型,构建基于参数硬共享的多任务学习模型,实验结果显示,分类准确率最高可达79.96%;最后,针对参数硬共享无法有效挖掘子任务间关联性的问题,首次提出基于参数稀疏共享的多任务学习模型,该模型通过联合训练,自动挖掘子任务间相关性,裁剪多余网络,并进行网络参数共享,实验结果显示,提出的基于MFCC特征的参数稀疏共享的多任务分类模型性能最优,分类准确率最高可达83.59%。
2. 矿井带式输送机运行状态预测方法
- 李敬兆；孙杰臣；叶桐舟
- 摘要：传感器监测数据结合神经网络预测模型是矿井带式输送机运行状态预测的主流方法,但利用接触式传感器对带式输送机运行状态进行监测存在安装不便、数据误差大等问题,导致带式输送机运行状态预测精度不高。针对该问题,提出了一种基于音频信号的矿井带式输送机运行状态预测方法。首先,采用高通滤波器和Boll谱减法对带式输送机运行时的原始音频信号进行滤波降噪处理。然后,通过预加重、分帧加窗、傅里叶变换、梅尔滤波器能量计算、离散余弦变换等提取音频信号的梅尔频率倒谱系数(MFCC)第1维分量(MFCC_(0)),并输入至残差块优化的卷积神经网络结合长短期记忆网络(Res-CNN-LSTM)预测模型,以减少预测模型的输入数据量。最后,通过添加残差块的CNN自适应提取带式输送机音频信号的MFCC_(0)空间特征并对数据进行降维,基于LSTM提取降维数据的时间特征,从而提高带式输送机运行状态预测精度。实验结果表明,MFCC_(0)可有效表征带式输送机不同运行状态时的音频信号特征;与CNN,LSTM,CNN-LSTM模型相比,Res-CNN-LSTM模型对带式输送机运行状态的预测更准确。
- 带式输送机
- 运行状态预测
- 音频信号
- MFCC
- 残差块
- CNN
- LSTM
3. 基于嵌入式系统的婴儿哭啼监测器
- 钟鹏飞；谭平；汤悦；龙帅；邱辉
- 摘要：为了缓解许多家长“带孩难”的困扰,本文设计了一个基于嵌入式的婴儿哭啼监测系统。该系统用树莓派嵌入式微系统作为中控处理器,搭载音频采集器和蜂鸣报警器等外部设备,通过提取梅尔频率倒谱系数、过零率等特征参数,利用SVM算法实现对婴儿哭声的识别,并将结果通过无线传输功能发送到家长的终端设备。实验结果表明,该系统实现了对婴儿哭啼的有效监测,并具有良好的性能。
- 婴儿哭声
- 树莓派
- MFCC
- SVM
4. 基于MFCC和ResNet的鱼类行为识别
- 胥婧雯；于红；李海清；程思奇；郑国伟；谷立帅；李响；龚德华；邢彬彬；股雷明
- 摘要：针对在极暗或无光条件下,采用计算机视觉手段进行鱼类行为识别效果不好的问题,本文提出了利用声音信号识别鱼类行为的方法;通过观察和试验发现鱼类的摄食、游泳等行为具有声音差异小、特征学习难等特点,基于上述发现,提出采用具有较强特征表达能力、能区别细微特征的MFCC(Mel-frequency cepstral coefficient,MFCC)特征系数表示鱼类行为声音信号特征&为有效学习不同鱼类行为的细粒度声音特征,采用残差网络(Residual Neural Network,ResNet)进行低维细节特征与高维语义特征融合,以便更好地保证特征完整性、提高识别效果。为验证所提出方法的有效性,设计了3组对比试验,用大连海洋大学鱼类行为学实验室采集的数据验证了算法的有效性,试验结果表明,鱼类行为识别的正确率、召回率和F1值均达到99%。研究表明,基于MFCC和ResNet的鱼类行为识别方法可以有效识别鱼类的游泳、摄貪等行为,为鱼类行为识别研究提供了新思路和新方法。
5. 基于MFCC加权动态特征组合的声纹识别技术在地下电缆防护的应用
- 李伟；曾繁洋；王博；陈忠斌
- 摘要：地下电缆在使用过程中,容易受到工程车辆作业破坏,针对这种情况,文章提出将声纹识别技术应用在地下电缆防护中,通过收集环境声音,判断电缆周围是否存在工程车辆作业,及时向有关部门发出预警。在声纹识别过程中,提出加权动态梅尔频率倒谱系数(mel frequency cepstrum coefficient,MFCC)作为声纹识别的特征参数,由梅尔倒谱系数及其加权的一阶和二阶差分系数合并而成,不仅能够反映音频信号的静态特性,还在很大程度上逼近音频的动态特性,并且与常用的特征参数相比,计算复杂程度更低。通过实验证明,以加权动态MFCC特征参数作为高斯混合模型–通用背景模型(gaussian mixture modeluniversal background,GMM-UBM)的特征参数的工程车辆识别系统,能够在提高识别率的情况下,大大降低系统的运行时间,以此实现地下电缆防护。
6. 基于Φ-OTDR系统的声波信号管道监测方法
- 张旭
- 摘要：为了准确地掌握管道线路的运行状态,保障油气管道的安全运行,在基于相位敏感光时域反射(Φ-OTDR)原理的光纤分布式振动系统的基础上,提出了一种泄漏声波信号监测方法。介绍了Φ-OTDR系统的结构和工作原理。针对管道周围环境复杂与噪音强的问题,提出一种新型小波阈值算法对信噪进行降噪处理。选用梅尔倒谱系数(Mel Frequency Cepstral Coefficents,MFCC)作为声波信号的特征向量,建立BP(Back Propagation)神经网络识别模型完成管道泄漏识别。实验结果表明,文中提出的BP神经网络泄漏识别方法有较好的识别率,且经过新型小波阈值函数算法降噪后,其平均识别率比降噪前提高了26.74%,最高识别率达到91.1%,具有一定的应用潜力。
7. 基于贝叶斯判别法对音乐特征信号的分类研究
- 常凤；徐小华；胡忠旭
- 摘要：在大量的乐库中,对音乐进行有效、快速的分类已是研究热点。各个音乐App按照音乐流派识别并推送用户感兴趣的音乐,可以提高用户使用体验和对平台的使用黏性。文章从音乐的流派进行研究,提取四种不同类型音乐信号的Mel频率倒谱系数(Mel FrequencyCestrumCoefficient,MFCC)(24个数值)作为特征值,利用贝叶斯分类算法对80组样本进行分类研究,判别准确率为97.5%;同时,文章分别用贝叶斯分类、BP神经网络等五种不同分类算法,对20组测试数据进行分类判别。结果表明,贝叶斯分类具有较高的音乐分类准确度。
- MFCC
- 贝叶斯算法
- 音乐
- 特征信号
- 分类
8. 基于pso-bp神经网络的中国民族乐器识别研究
- 李峰；安冉
- 摘要：针对传统的中国民族乐器识别准确率较低的问题,本文综合分析了群体智能优化算法的特性以及神经网络分类模型的误差率和训练效率,提出了一种基于粒子群优化算法(particle swarm optimization,pso)优化改进的bp神经网络分类模型,采用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)作为中国民族乐器音乐识别的分类特征,实验结果表明该分类模型具有较高的分类准确率和适用性,其准确率达到99.78%.
9. 基于融合频域和时域特征的说话人识别
- 龙翔；夏秀渝
- 摘要：针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维。降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练。仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高。
10. 一种多特征融合的说话人辨认算法
- 孙佳宁；于玲
- 摘要：针对在智能音箱中容易出现误唤醒情况,即设备被环境音错误激活的问题,该文提出了一种多特征融合的说话人辨认算法。该算法在特征提取部分通过将短时能量、线性预测倒谱系数(LPCC)、梅尔频率倒谱系数(MFCC)及其一阶动态特征差分系数进行有机结合来提高说话人辨认算法的识别率。使用自建语音库进行仿真测试,仿真实验结果表明,与采用传统特征提取的GMM说话人辨认相比,采用改进的特征提取方法能显著提高说话人辨认的识别正确率。

1. 语音检测与识别的特征提取方法
- 何选森；尹许梅；刘福星
- 《2010国际仪器仪表与测控技术大会》 | 2010年
- 摘要：根据语音信号是短时平稳的而高斯噪声的高阶累积量为零的特点,首先提出一种语音激活检测算法,利用通信接收端观测信号的高阶累积量并结合短时能量阀值来检测语音信号。在此基础上,为了对检测出来语音信号的说话人进行识别,提出了一种改进的MFCC特征提取算法,在预处理阶段采用一种新的窗函数抑制旁瓣,并引入Bark子波变换以适应人的听觉系统。实验结果表明,在低信噪比环境下本文方法能进一步提高语音的检测和识别性能。
2. 语音检测与识别的特征提取方法
- 何选森；尹许梅；刘福星
- 《2010国际仪器仪表与测控技术大会》 | 2010年
- 摘要：根据语音信号是短时平稳的而高斯噪声的高阶累积量为零的特点,首先提出一种语音激活检测算法,利用通信接收端观测信号的高阶累积量并结合短时能量阀值来检测语音信号。在此基础上,为了对检测出来语音信号的说话人进行识别,提出了一种改进的MFCC特征提取算法,在预处理阶段采用一种新的窗函数抑制旁瓣,并引入Bark子波变换以适应人的听觉系统。实验结果表明,在低信噪比环境下本文方法能进一步提高语音的检测和识别性能。
3. 语音检测与识别的特征提取方法
- 何选森；尹许梅；刘福星
- 《2010国际仪器仪表与测控技术大会》 | 2010年
- 摘要：根据语音信号是短时平稳的而高斯噪声的高阶累积量为零的特点,首先提出一种语音激活检测算法,利用通信接收端观测信号的高阶累积量并结合短时能量阀值来检测语音信号。在此基础上,为了对检测出来语音信号的说话人进行识别,提出了一种改进的MFCC特征提取算法,在预处理阶段采用一种新的窗函数抑制旁瓣,并引入Bark子波变换以适应人的听觉系统。实验结果表明,在低信噪比环境下本文方法能进一步提高语音的检测和识别性能。
4. 语音检测与识别的特征提取方法
- 何选森；尹许梅；刘福星
- 《2010国际仪器仪表与测控技术大会》 | 2010年
- 摘要：根据语音信号是短时平稳的而高斯噪声的高阶累积量为零的特点,首先提出一种语音激活检测算法,利用通信接收端观测信号的高阶累积量并结合短时能量阀值来检测语音信号。在此基础上,为了对检测出来语音信号的说话人进行识别,提出了一种改进的MFCC特征提取算法,在预处理阶段采用一种新的窗函数抑制旁瓣,并引入Bark子波变换以适应人的听觉系统。实验结果表明,在低信噪比环境下本文方法能进一步提高语音的检测和识别性能。
5. 语音检测与识别的特征提取方法
- 何选森；尹许梅；刘福星
- 《2010国际仪器仪表与测控技术大会》 | 2010年
- 摘要：根据语音信号是短时平稳的而高斯噪声的高阶累积量为零的特点,首先提出一种语音激活检测算法,利用通信接收端观测信号的高阶累积量并结合短时能量阀值来检测语音信号。在此基础上,为了对检测出来语音信号的说话人进行识别,提出了一种改进的MFCC特征提取算法,在预处理阶段采用一种新的窗函数抑制旁瓣,并引入Bark子波变换以适应人的听觉系统。实验结果表明,在低信噪比环境下本文方法能进一步提高语音的检测和识别性能。
6. 基于LPCC和MFCC的藏语语音端点检测算法
- 李洪波；于洪志
- 《2007中国计算机大会》 | 2007年
- 摘要：端点检测是语音识别系统预处理阶段遇到的第一个关键技术.该算法根据藏语元音/辅音频谱特性差异，对语音信号分高/低频带后再分别处理的思想，符合藏语语音的清/浊对立信息分布特点，然后分别提取倒谱系数作为端点检测的特征，因为倒谱特征所含的信息比其他参数多，能较好地表征语音信号，语音质量好，识别正确率高;检测时采取自适应噪声参数估计，根据倒谱距离轨迹判决起止端点，仿真结果表明了它的优越性。
- 端点检测
- LPCC
- MFCC
- 安多藏语
7. 基于LPCC和MFCC的藏语语音端点检测算法
- 李洪波；于洪志
- 《2007中国计算机大会》 | 2007年
- 摘要：端点检测是语音识别系统预处理阶段遇到的第一个关键技术.该算法根据藏语元音/辅音频谱特性差异，对语音信号分高/低频带后再分别处理的思想，符合藏语语音的清/浊对立信息分布特点，然后分别提取倒谱系数作为端点检测的特征，因为倒谱特征所含的信息比其他参数多，能较好地表征语音信号，语音质量好，识别正确率高;检测时采取自适应噪声参数估计，根据倒谱距离轨迹判决起止端点，仿真结果表明了它的优越性。
- 端点检测
- LPCC
- MFCC
- 安多藏语
8. 基于LPCC和MFCC的藏语语音端点检测算法
- 李洪波；于洪志
- 《2007中国计算机大会》 | 2007年
- 摘要：端点检测是语音识别系统预处理阶段遇到的第一个关键技术.该算法根据藏语元音/辅音频谱特性差异，对语音信号分高/低频带后再分别处理的思想，符合藏语语音的清/浊对立信息分布特点，然后分别提取倒谱系数作为端点检测的特征，因为倒谱特征所含的信息比其他参数多，能较好地表征语音信号，语音质量好，识别正确率高;检测时采取自适应噪声参数估计，根据倒谱距离轨迹判决起止端点，仿真结果表明了它的优越性。
- 端点检测
- LPCC
- MFCC
- 安多藏语
9. 基于LPCC和MFCC的藏语语音端点检测算法
- 李洪波；于洪志
- 《2007中国计算机大会》 | 2007年
- 摘要：端点检测是语音识别系统预处理阶段遇到的第一个关键技术.该算法根据藏语元音/辅音频谱特性差异，对语音信号分高/低频带后再分别处理的思想，符合藏语语音的清/浊对立信息分布特点，然后分别提取倒谱系数作为端点检测的特征，因为倒谱特征所含的信息比其他参数多，能较好地表征语音信号，语音质量好，识别正确率高;检测时采取自适应噪声参数估计，根据倒谱距离轨迹判决起止端点，仿真结果表明了它的优越性。
- 端点检测
- LPCC
- MFCC
- 安多藏语
10. 几种改进的MFCC特征提取方法在说话人识别中的应用
- 许鑫；苏开娜；胡起秀
- 《第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议（第一届全国和谐人机环境联合学术大会）》 | 2005年
- 摘要： Mel频率倒谱系数(MFCC)表征了人类的听觉特征.目前国内外提出了一些比较好的MFCC改进算法,可以提高语音特征提取的鲁棒性.本文介绍了一些在语音识别中取得一定效果的Mel倒谱提取的改进算法.将这些算法应用于文本无关的说话人识别,并在此基础上提出了四种改进方法.在100人和200人的电话语料库中,分别进行同信道和不同信道的实验,使识别率获得了不同程度的提高.尤其在不同信道上的识别效果更为显著.其中频率掩蔽滤波与ExpoLog尺度相结合的方法识别效果最好:在用座机语音建模手机语音测试的实验中,识别率从基准系统的16.327﹪上升到38.776﹪;在用手机语音建模座机语音测试的实验中,识别率从基准系统的8﹪上升到40﹪.可见,所提出的改进方法是非常有效的.

1. 基于MFCC特征编码的组合型超宽带交叉极化无芯片RFID标签
- 浙江大学
- 公开公告日期：2022.02.18
- 摘要：本发明公开了一种基于MFCC特征编码的组合型超宽带交叉极化无芯片RFID标签，包括标签贴片单元、介质基板及接地层；标签贴片单元包括条形码型谐振单元和双L型谐振单元；条形码型谐振单元由五个相同的长方形贴片平行排列并逆时针旋转而成；双L型谐振单元由四个相同的长方形贴片组成的两个L型贴片反向组合而成；发射天线发射水平极化电磁波作为询问信号，信号经标签反射后的散射波被接收天线获取，接收机获取散射波频谱，频谱通过傅里叶逆变换转换到时域信号，通过窗口提取到标签的响应，通过预加重、短时傅里叶变换等步骤提取MFCC特征；标签实现2‑8GHz的MFCC特征编码方式，共可以实现15位编码。本发明具有成本低、编码容量大、易于在实际环境中检测等优点。
2. 一种基于MFCC特征提取的交叉路口碰撞音频预警测评方法
- 东南大学
- 公开公告日期：2022.04.08
- 摘要：本发明公开了一种基于MFCC特征提取的交叉路口碰撞音频预警测评方法，该方法需要在被测对象上安装组合导航以及麦克风传感器采集测评所需基础参数数据。对麦克风采集到的音频，采用双门限法提取有效语音段，对每一段语音提取其MFCC特征，并采用DTW算法将提取到的特征与标准特征比较，得到预警信号片段及其发出时刻。对组合导航采集到的位置、速度信息，采用插值方法进行数据处理，并结合语音识别的结果进行测评指标分析。本发明与交叉口防碰撞预警应用的实现原理和技术无关，从第三方的角度开展测评，具有测评项目全面，测评指标准确可靠的特点。
3. 一种基于MFCC相似矩阵的语音音乐分离方法
- 昆明理工大学
- 公开公告日期：2022.05.27
- 摘要：本发明公开了一种基于MFCC相似矩阵的语音音乐分离方法，属于语音音频处理领域。传统的语音参数一般为39维MFCC参数。在带背景音乐的讲话环境下，说话人的语音信息在相邻帧之间是不连续的，而背景音乐的相邻帧之间的语音信息变化是连续且缓慢的。该方法在此规律的基础上，对39维MFCC参数求解相似矩阵SMFCC，获取语音相邻帧之间的相关性，根据统计规律区分出讲话语音段和纯背景音乐段并将其切割分离，然后分别将背景音乐段和语音段输入7层双向LSTM神经网络进行数据分离，最后再对分离的数据进行整合，得到分离的说话人声音和背景音乐声音。经过测试，该方法可以提高整体的语音段和非语音段的识别准确率，且运算速度快、计算量较小。
4. 基于MFCC和BP神经网络的说话人识别系统及方法
- 东风汽车集团股份有限公司
- 公开公告日期：2022.09.27
- 摘要：本发明公开了基于MFCC和BP神经网络的说话人识别系统，它的语音信号预处理模块依次对语音信号进行分帧、选帧和预加重的信号预处理，语音信号加窗处理模块对预处理后的语音信号进行加窗处理，频谱分析模块对加窗处理后的语音信号进行频谱分析，滤波模块对语音信号各帧频谱的谱线能量进行美尔滤波处理，离散余弦变换模块用于对美尔滤波后的语音信号各帧频谱进行离散余弦变换；BP神经网络模块生成BP神经网络训练数据集，并为每个说话人分别建立对应的BP神经网络，对各个BP神经网络进行训练。本发明提高了说话人识别的可靠性和准确性。
5. 一种基于MFCC系数的猪只叫声识别系统及方法
- 天津大学四川创新研究院
- 公开公告日期：2022-03-18
- 摘要：本发明公开了一种基于MFCC梅尔倒谱系数的猪只叫声识别系统，其特征在于包括音频处理模块、特征提取模块和网络识别模块；所述音频处理模块将采集到的猪只叫声进行滤波、分帧和加窗处理，分割得到有效声音片段；特征提取模块是提取有效声音片段的MFCC系数及其一阶差分系数采用时间规整算法获得统一规格的三维特征矩阵；网络识别模块是将特征矩阵输入到3D深度残差网络进行卷积、池化并对最终数据进行线性变换并分类，从而识别猪只叫声的类别。还公开了一种基于MFCC梅尔倒谱系数的猪只叫声识别方法。本发明具有非接触性、非应激性、实时性好、监测方便的优点，具有良好的应用前景。
6. 基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置
- 国网天津市电力公司
- 国家电网有限公司
- 公开公告日期：2022-03-15
- 摘要：本发明提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置，涉及电缆隐患识别技术领域，方法包括：获取第一声音数据，第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；对第二声音数据进行频域变换以获取第三声音数据；将第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对扩散化的高斯混合模型分类器参数进行优化；利用第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。通过本发明可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。
7. 一种基于改进MFCC的非语音类音频特征提取方法
- 大连交通大学
- 公开公告日期：2022-06-10
- 摘要：本发明涉及音频特征提取技术领域，具体公开了一种基于改进MFCC的非语音类音频特征提取方法，包括如下步骤：采集声音信号并对采集到的声音信号进行预处理；将预处理后的声音信号进行MFCC特征提取；将预处理后的声音信号进行EMD分解获得IMF分量，提取IMF分量的时域特征向量和频域特征向量；将MFCC系数做一阶差分与二阶差分，得到组成MFCC的动态特征向量；将计算出的MFCC特征向量、时域特征向量、频域特征向量和MFCC动态特征向量进行特征融合，获得改进后的多尺度MFCC特征向量。本发明可以有效提取音频信号的高频部分，且声音信号特征信息更加丰富、全面，此外，本发明的方法不仅可以处理语音类音频，也可以处理非语音类型的音频如机械声等的音频信号。
8. 一种基于共振峰分布的改进MFCC参数语音识别算法
- 南京邮电大学
- 公开公告日期：2022-08-30
- 摘要：本发明公开了一种基于共振峰分布的改进MFCC参数语音识别算法，包括分割语音频谱得到不同频谱区间，利用线性预测法和倒谱法分别估算一帧语音的共振峰频率分布；统计不同频谱区间上共振峰频率分布，依据共振峰在不同频谱区间上的分布，利用熵权法求取各个区间在一帧语音音频上的权重；进一步计算MFCC参数，依据Mel频率和实际频率的关系，找到MFCC参数对应的区间权重，进行乘积得到改进的MFCC参数。本发明采用了本发明通过熵权法对各频率区间求得权重系数(以三种方法分别求取的共振峰频率个数为标准)，提取共振峰频率特征得到的权重系数与多通道梅尔滤波器组对应频率区间通道输出之间的乘积，从而能够实现较高的语音识别率。
9. 一种基于MFCC融合GRU的音频特征分析电动单轨吊电机故障预测系统
- 安徽理工大学
- 公开公告日期：2022-06-17
- 摘要：本发明涉及一种基于MFCC融合GRU的音频特征分析电动单轨吊电机故障预测系统，所述系统由处理器a、电源模块a、LoRa无线通信模块a、分布式音频采集模块、微处理器b、电源模块b、LoRa无线通信模块b、分布式文件存储模块、MFCC音频特征提取模块、GRU‑MLP音频深度时序特征分析模块、RS485通信模块、WiFi无线通信模块c、上位机监控中心以及移动终端组成。利用MFCC对音频数据进行预处理，并获取其13维特征；考虑到音频信号的时序性，通过GRU与MLP构建深度神经网络模型对音频特征进行处理和分类，实现电机的故障预测。
10. 一种改进MFCC算法的风机叶片故障诊断方法
- 河北工业大学
- 公开公告日期：2022-08-02
- 摘要：本发明为一种改进MFCC算法的风机叶片故障诊断方法，首先对传统MFCC算法的物理频率与梅尔频率转换公式进行改进，将声音信号的全频域分为三个频段，对三个频段赋予不同权重，故障信号频段的权重最大，权重越大频段内放置滤波器的个数越多，使得改进后的MFCC算法更加关注故障信号频段，提取到更多故障信息；其次，利用K‑means聚类算法对MFCC特征矩阵的所有样本特征帧进行聚类，并利用群智能算法对故障信号频段进行迭代寻优；最后，将聚类结果输入到SVM中进行训练，将训练后的SVM用于故障诊断。该方法得到的聚类结果条形图具有良好的周期性，聚类结果更准确，有利于提高故障诊断的准确率。

MFCC

MFCC—发文量

MFCC—发文趋势图

MFCC-研究学者

MFCC-相关主题

MFCC-相关期刊

MFCC-相关会议

MFCC
-研究学者

MFCC
-相关主题

MFCC
-相关期刊

MFCC
-相关会议