您现在的位置: 首页> 研究主题> MFCC

MFCC

MFCC的相关文献在1999年到2022年内共计341篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、物理学 等领域,其中期刊论文247篇、会议论文6篇、专利文献88篇;相关期刊163种,包括人天科学研究、科技信息、弹箭与制导学报等; 相关会议6种,包括2010国际仪器仪表与测控技术大会、第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会)、中国声学学会2005年青年学术会议[CYCA'05]等;MFCC的相关文献由872位作者贡献,包括刘传银、梁庆真、刘浩等。

MFCC—发文量

期刊论文>

论文:247 占比:72.43%

会议论文>

论文:6 占比:1.76%

专利文献>

论文:88 占比:25.81%

总计:341篇

MFCC—发文趋势图

MFCC

-研究学者

  • 刘传银
  • 梁庆真
  • 刘浩
  • 张浩
  • 罗挺
  • 高小清
  • 于慧伶
  • 刘贤洪
  • 张永皋
  • 李坤
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 万苗; 任杰; 马苗; 曹瑞
    • 摘要: 近年来,随着深度学习技术在语音识别领域的出色表现,基于深度学习的语音识别系统被广泛应用于智能家居、智能客服、会议纪要、实时字幕等多个应用场景。但由于中国民族众多,语言文化差异大、方言多样复杂等特点,给语音识别系统带来了很大的挑战,特别针对短时语音段方言识别任务,已有的中国方言分类系统性能依然较差。针对特征参数梅尔倒谱系数(mel-scale frequency cepstral coefficients,MFCC)进行研究分析,面向中国十种方言数据集构建基于深度学习的方言分类模型。首先,针对MFCC构建基于短期记忆网络(long short-term memory,LSTM)的单任务学习模型,准确率可达79.04%;然后,深入挖掘方言地域特征,提出以方言所在区域为辅助任务的多任务模型,构建基于参数硬共享的多任务学习模型,实验结果显示,分类准确率最高可达79.96%;最后,针对参数硬共享无法有效挖掘子任务间关联性的问题,首次提出基于参数稀疏共享的多任务学习模型,该模型通过联合训练,自动挖掘子任务间相关性,裁剪多余网络,并进行网络参数共享,实验结果显示,提出的基于MFCC特征的参数稀疏共享的多任务分类模型性能最优,分类准确率最高可达83.59%。
    • 李敬兆; 孙杰臣; 叶桐舟
    • 摘要: 传感器监测数据结合神经网络预测模型是矿井带式输送机运行状态预测的主流方法,但利用接触式传感器对带式输送机运行状态进行监测存在安装不便、数据误差大等问题,导致带式输送机运行状态预测精度不高。针对该问题,提出了一种基于音频信号的矿井带式输送机运行状态预测方法。首先,采用高通滤波器和Boll谱减法对带式输送机运行时的原始音频信号进行滤波降噪处理。然后,通过预加重、分帧加窗、傅里叶变换、梅尔滤波器能量计算、离散余弦变换等提取音频信号的梅尔频率倒谱系数(MFCC)第1维分量(MFCC_(0)),并输入至残差块优化的卷积神经网络结合长短期记忆网络(Res-CNN-LSTM)预测模型,以减少预测模型的输入数据量。最后,通过添加残差块的CNN自适应提取带式输送机音频信号的MFCC_(0)空间特征并对数据进行降维,基于LSTM提取降维数据的时间特征,从而提高带式输送机运行状态预测精度。实验结果表明,MFCC_(0)可有效表征带式输送机不同运行状态时的音频信号特征;与CNN,LSTM,CNN-LSTM模型相比,Res-CNN-LSTM模型对带式输送机运行状态的预测更准确。
    • 钟鹏飞; 谭平; 汤悦; 龙帅; 邱辉
    • 摘要: 为了缓解许多家长“带孩难”的困扰,本文设计了一个基于嵌入式的婴儿哭啼监测系统。该系统用树莓派嵌入式微系统作为中控处理器,搭载音频采集器和蜂鸣报警器等外部设备,通过提取梅尔频率倒谱系数、过零率等特征参数,利用SVM算法实现对婴儿哭声的识别,并将结果通过无线传输功能发送到家长的终端设备。实验结果表明,该系统实现了对婴儿哭啼的有效监测,并具有良好的性能。
    • 胥婧雯; 于红; 李海清; 程思奇; 郑国伟; 谷立帅; 李响; 龚德华; 邢彬彬; 股雷明
    • 摘要: 针对在极暗或无光条件下,采用计算机视觉手段进行鱼类行为识别效果不好的问题,本文提出了利用声音信号识别鱼类行为的方法;通过观察和试验发现鱼类的摄食、游泳等行为具有声音差异小、特征学习难等特点,基于上述发现,提出采用具有较强特征表达能力、能区别细微特征的MFCC(Mel-frequency cepstral coefficient,MFCC)特征系数表示鱼类行为声音信号特征&为有效学习不同鱼类行为的细粒度声音特征,采用残差网络(Residual Neural Network,ResNet)进行低维细节特征与高维语义特征融合,以便更好地保证特征完整性、提高识别效果。为验证所提出方法的有效性,设计了3组对比试验,用大连海洋大学鱼类行为学实验室采集的数据验证了算法的有效性,试验结果表明,鱼类行为识别的正确率、召回率和F1值均达到99%。研究表明,基于MFCC和ResNet的鱼类行为识别方法可以有效识别鱼类的游泳、摄貪等行为,为鱼类行为识别研究提供了新思路和新方法。
    • 李伟; 曾繁洋; 王博; 陈忠斌
    • 摘要: 地下电缆在使用过程中,容易受到工程车辆作业破坏,针对这种情况,文章提出将声纹识别技术应用在地下电缆防护中,通过收集环境声音,判断电缆周围是否存在工程车辆作业,及时向有关部门发出预警。在声纹识别过程中,提出加权动态梅尔频率倒谱系数(mel frequency cepstrum coefficient,MFCC)作为声纹识别的特征参数,由梅尔倒谱系数及其加权的一阶和二阶差分系数合并而成,不仅能够反映音频信号的静态特性,还在很大程度上逼近音频的动态特性,并且与常用的特征参数相比,计算复杂程度更低。通过实验证明,以加权动态MFCC特征参数作为高斯混合模型–通用背景模型(gaussian mixture modeluniversal background,GMM-UBM)的特征参数的工程车辆识别系统,能够在提高识别率的情况下,大大降低系统的运行时间,以此实现地下电缆防护。
    • 张旭
    • 摘要: 为了准确地掌握管道线路的运行状态,保障油气管道的安全运行,在基于相位敏感光时域反射(Φ-OTDR)原理的光纤分布式振动系统的基础上,提出了一种泄漏声波信号监测方法。介绍了Φ-OTDR系统的结构和工作原理。针对管道周围环境复杂与噪音强的问题,提出一种新型小波阈值算法对信噪进行降噪处理。选用梅尔倒谱系数(Mel Frequency Cepstral Coefficents,MFCC)作为声波信号的特征向量,建立BP(Back Propagation)神经网络识别模型完成管道泄漏识别。实验结果表明,文中提出的BP神经网络泄漏识别方法有较好的识别率,且经过新型小波阈值函数算法降噪后,其平均识别率比降噪前提高了26.74%,最高识别率达到91.1%,具有一定的应用潜力。
    • 常凤; 徐小华; 胡忠旭
    • 摘要: 在大量的乐库中,对音乐进行有效、快速的分类已是研究热点。各个音乐App按照音乐流派识别并推送用户感兴趣的音乐,可以提高用户使用体验和对平台的使用黏性。文章从音乐的流派进行研究,提取四种不同类型音乐信号的Mel频率倒谱系数(Mel FrequencyCestrumCoefficient,MFCC)(24个数值)作为特征值,利用贝叶斯分类算法对80组样本进行分类研究,判别准确率为97.5%;同时,文章分别用贝叶斯分类、BP神经网络等五种不同分类算法,对20组测试数据进行分类判别。结果表明,贝叶斯分类具有较高的音乐分类准确度。
    • 李峰; 安冉
    • 摘要: 针对传统的中国民族乐器识别准确率较低的问题,本文综合分析了群体智能优化算法的特性以及神经网络分类模型的误差率和训练效率,提出了一种基于粒子群优化算法(particle swarm optimization,pso)优化改进的bp神经网络分类模型,采用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)作为中国民族乐器音乐识别的分类特征,实验结果表明该分类模型具有较高的分类准确率和适用性,其准确率达到99.78%.
    • 龙翔; 夏秀渝
    • 摘要: 针对单一特征参数表征语音信息不够全面的缺点,利用时域特征参数和频域不同特征参数的优点,融合频域特征参数MFCC、GFCC、MFCC一阶差分、GFCC一阶差分和时域特征参数短时能量,然后将多维度的融合特征参数进行主成分分析降维。降维后的特征参数送入双向长短时记忆神经网络模型进行识别训练。仿真实验表明,本文目标参数参与训练的说话人识别模型取得了99.61%的识别正确率,较其他说话人识别模型的识别率更高。
    • 孙佳宁; 于玲
    • 摘要: 针对在智能音箱中容易出现误唤醒情况,即设备被环境音错误激活的问题,该文提出了一种多特征融合的说话人辨认算法。该算法在特征提取部分通过将短时能量、线性预测倒谱系数(LPCC)、梅尔频率倒谱系数(MFCC)及其一阶动态特征差分系数进行有机结合来提高说话人辨认算法的识别率。使用自建语音库进行仿真测试,仿真实验结果表明,与采用传统特征提取的GMM说话人辨认相比,采用改进的特征提取方法能显著提高说话人辨认的识别正确率。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号