梅尔倒谱系数
梅尔倒谱系数的相关文献在2007年到2023年内共计91篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、地球物理学
等领域,其中期刊论文82篇、会议论文4篇、专利文献40460篇;相关期刊62种,包括中国管理信息化、实验室研究与探索、计算机仿真等;
相关会议4种,包括第十二届全国人机语言通讯学术会议(NCMMSC`2013)、浙江省电子学会2013年学术年会、第十四届中国智能交通年会等;梅尔倒谱系数的相关文献由261位作者贡献,包括严迪群、刘思思、吴震东等。
梅尔倒谱系数—发文量
专利文献>
论文:40460篇
占比:99.79%
总计:40546篇
梅尔倒谱系数
-研究学者
- 严迪群
- 刘思思
- 吴震东
- 周海军
- 周萍
- 姜皓龄
- 张丽
- 张家安
- 易子馗
- 景新幸
- 李燕萍
- 李琪
- 李磊
- 李程程
- 杨海燕
- 林乐
- 王宇星
- 王宏霞
- 王让定
- 章坚武
- 蒋翠清
- 谭建平
- 贾懋珅
- 赵文兵
- 郝峰
- 郭俊峰
- 陶定元
- 骆启帆
- Honglian Li
- LUO Qi-fan
- SOBOLEV Aleksei
- Tiantian Wang
- WU Zhen-dong
- ZHANG Jian-wu
- 乔倩
- 乔玉龙
- 付建梅
- 付新华
- 任国凤
- 何东健
- 何丽
- 何少岩
- 何正祥
- 余斌
- 余玟铮
- 侯昶宇
- 侯朋
- 冉国敬
- 冯冰
- 刘伟
-
-
李振雷;
李娜;
杨菲;
SOBOLEV Aleksei;
宋大钊;
王洪磊;
纳然;
曹亚利
-
-
摘要:
同步采集了煤样单轴压缩破坏过程的声发射全波形数据和应力数据,提取了声发射梅尔倒谱系数作为样本特征,定义煤样当前受力与其峰值载荷的比值为煤样的应力状态并将其作为样本标签,利用机器学习方法构建了煤样破坏状态的预测模型.结果表明:梅尔倒谱系数可以很好地表征煤样的破坏状态,该参量在煤样达到受力峰值80%后表现出明显突增或突降或先增加然后突降的规律,机器学习能够利用该样本特征建立煤样破坏状态预测模型进而预测煤样的危险状态,利用五折交叉验证方法评价模型的预测准确度达到88.61%,模型预测效果和稳定性良好;进一步讨论了不同重要度的梅尔倒谱系数组合作为样本特征对于模型预测效果的影响,发现样本特征中含有重要度高的特征和关键特征是模型预测准确度高的关键.这可为进一步完善煤岩动力灾害预测预警提供借鉴.
-
-
杨海涛;
王华朋;
牛瑾琳;
楚宪腾;
林暖辉
-
-
摘要:
为进一步提高语音欺骗检测的准确率,提出一种融合LSTM-GRU网络的语音逻辑访问攻击(语音转换、语音合成)检测方法。融合LSTM-GRU网络是由长短期记忆网络(Long short-term memory,LSTM)层、门控循环神经单元(Gated recurrent unit,GRU)层、丢弃层、批归一化层和全连接层串联结合的一种混合网络,其中LSTM层可以解决语音序列中的长时依赖问题,GRU层则可降低模型参数量。实验在ASVspoof2019 LA数据集上进行,提取20维的梅尔倒谱系数特征用于模型训练,在测试阶段使用训练好的LSTM-GRU模型对测试集中的语音进行欺骗检测。与GRU网络及LSTM网络的比较结果表明:LSTM-GRU网络在3种网络模型中正确识别率最高,等错误率(Equal error rate,EER)比ASVspoof2019挑战赛所提供基线系统低27.07%,对逻辑访问攻击语音检测的平均准确率达到98.04%,并且融合LSTM-GRU网络具备训练时间短、防止过拟合及稳定性高等优点。结果证明本文方法可有效应用于语音逻辑访问攻击检测任务中。
-
-
王莹;
侯朋;
吴迪;
王文冠;
李光远
-
-
摘要:
传统的被动目标识别主要依靠声呐员的作用,随着人工智能的迅速发展,水下目标智能识别成为未来发展的趋势。针对这一问题,根据舰船辐射噪声特性,提出基于特征融合的舰船目标识别方法,通过提取基于人耳听觉感知的梅尔倒谱系数特征、基于循环平稳分析的谱相关密度函数特征,构建特征层融合和决策层融合的特征融合模型,利用深度学习中的卷积神经网络进行舰船目标识别。利用4种舰船辐射噪声实测数据进行验证,结果表明,所提出的决策层融合算法能够明显提高舰船目标识别率。
-
-
邵睿;
彭硕;
查文文;
陈成鹏;
辜丽川;
焦俊
-
-
摘要:
以5种猪声为研究对象,首先,用维纳滤波和端点检测对猪声进行预处理,获得有效语料;然后,提取梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)制作样本集,再构建基于BiLSTM的声学模型学习样本集;最后用训练好的模型对猪声MFCC序列进行分类,实现生猪音频识别。结果表明:(1)通过5折交叉试验验证,5组模型总体识别率均达到90%,最高组为92.52%;(2)用样本集外语料对最优组模型进行算法应用测试,模型对进食、咳嗽、发情、嚎叫和哼叫的样本识别率分别为88.35%、93.65%、90.38%、88.46%、92.63%,总体识别率为90.70%。
-
-
欧昀;
周晓彦;
李大鹏
-
-
摘要:
为了解决高校深度学习教学活动中缺乏实际案例演示的问题,设计了利用卷积神经网络(CNN)进行鸟声识别的实验。对已有常见鸟声数据库中的鸟鸣声音频进行梅尔倒谱系数(MFCC)特征提取,利用短时傅里叶变换(STFT)结果绘制出STFT语谱图,利用Python在TensorFlow框架下构建卷积神经网络的鸟声识别系统。实验过程中既可利用MFCC和STFT语谱图中2种特征参数分别在各自训练好的网络模型下进行对比实验,也可作为创新性实验,由学生自行编程设计CNN模型实现鸟声识别,通过识别结果验证模型的优劣。
-
-
更太加;
张新意;
魏建国
-
-
摘要:
口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基于隐马尔可夫模型建立了一套骨导音识别系统,在进行骨导音识别之前,通过分帧加窗、提取梅尔频率倒谱系数,对其进行模型训练;在识别过程中,找出与待测音频信号和模板库中匹配度最高的模型,以其模型输出结果作为最后的识别结果。该方法的识别结果可以达到84%,实验结果表明该方法具有一定的可行性。
-
-
肖毓增;
付新华;
杨胜仪;
陈文清
-
-
摘要:
电力变压器是利用电磁感应在电路之间传递电力的设备,是电厂设备的关键部件。文中提出一种利用声音信号实现变压器故障检测的方法,即基于朴素贝叶斯分类器的变压器故障检测方法与用于声音信号的梅尔频率倒频谱系数(MFCC)特征向量,特别是基于MFCC的动态特征。这些声音信号可以通过传感器方便采集,首先,将采集的声音信号经过预处理,特别使用了汉明窗函数;然后,对声音信号进行声学特征提取,将静态与动态特征向量组成新的特征向量;最后,将特征向量导入朴素贝叶斯分类器进行训练,朴素贝叶斯分类器可监测变压器故障种类,及时通知检修人员修理存在故障的电力设备。实验结果表明,朴素贝叶斯分类器对常见的4种变压器工作状态的分类具有较高的准确率。
-
-
杜海云;
王宏霞
-
-
摘要:
音调篡改技术是语音伪造常用的一种技术手段,可能对说话人验证系统造成威胁。对噪声和压缩场景下的伪造语音检测问题进行了研究,提出了基于改进胶囊网络的音调篡改检测算法。为增强鲁棒性,将相对频谱感知线性预测(RelAtive SpecTrAl-Perceptual Linear Predictive,RASTAPLP)和梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)融合为新特征,并输入优化的胶囊网络,对经加噪和压缩处理的音频进行检测。实验结果表明,该算法在已知噪声、未知噪声和压缩场景下的检测准确率均在98%以上,和现有的一些算法相比,具有较高的检测准确率和鲁棒性。
-
-
梁小林;
沈湘菲;
梁曌;
邱海琳
-
-
摘要:
为了识别大词汇量下连续长沙话方言语音,提出了基于CTC算法的门控线性单元神经网络模型.先通过梅尔倒谱系数提取语音的特征参数,再把提取的特征参数输入门控线性单元神经网络,用CTC算法进行训练优化,得到输入序列整个的预测标签.最后在自建的长沙话方言语料库上,以词错率作为评价指标,对CTC模型、GRU模型和CTC-GRU模型进行对比,结果表明CTC-GRU模型相对于其他2个模型收敛速度更快,结果更精准.
-
-
余斌;
宋兴荣;
周挺;
罗林波;
李辉;
车亮
-
-
摘要:
电池储能电站功率转换系统(power conversion system,PCS)故障诊断在储能电站智能运维中发挥着重要作用。现有方法在非侵入式识别PCS内部IGBT开路故障时,易出现信号特征提取困难、数据维度爆炸以及阈值判定区间不稳定等问题。提出一种基于梅尔倒谱系数(Mel-scale frequency cepstral coefficients,MFCC)特征集的储能变流器开路故障诊断方法。首先,以交流侧三相电流为输入信号,通过分析不同频率区间的信号频谱能量分布情况和包络特征,构建MFCC故障特征数据集。然后,结合核主成分分析(kernel principal components analysis,KPCA),实现充放电工况下非线性故障特征的降维筛选;其次,以低维故障特征集为输入,构建基于贝叶斯优化算法(bayesian optimization algorithm,BOA)与一维卷积神经网络(1d-convolutional neural network,CNN-1D)的故障状态诊断模型;最后,通过并网储能变流器的故障仿真实验,与现有方法进行比较,结果表明:所提方法在复杂的噪声环境下的鲁棒性和准确性更优。
-
-
-
-
-
-
-
-
-
- 《第十四届中国智能交通年会》
-
摘要:
交通环境中声音信号能有力地补充自动驾驶汽车雷达、摄像头等传感器感知环境能力的不足,获取更全面的交通环境信息.本文将梅尔频率倒谱系数与时频域特征参数的组合特征向量,应用到支持向量机分类器中,完成交通环境特种声音的识别.实验结果表明交通环境特种声音在信噪比高于50dB的情况下,平均识别率高达96.67%,弥补了当前自动驾驶环境感知系统对于声学环境感知的缺失.
-
-
- 《第十四届中国智能交通年会》
-
摘要:
交通环境中声音信号能有力地补充自动驾驶汽车雷达、摄像头等传感器感知环境能力的不足,获取更全面的交通环境信息.本文将梅尔频率倒谱系数与时频域特征参数的组合特征向量,应用到支持向量机分类器中,完成交通环境特种声音的识别.实验结果表明交通环境特种声音在信噪比高于50dB的情况下,平均识别率高达96.67%,弥补了当前自动驾驶环境感知系统对于声学环境感知的缺失.
-
-
- 《第十四届中国智能交通年会》
-
摘要:
交通环境中声音信号能有力地补充自动驾驶汽车雷达、摄像头等传感器感知环境能力的不足,获取更全面的交通环境信息.本文将梅尔频率倒谱系数与时频域特征参数的组合特征向量,应用到支持向量机分类器中,完成交通环境特种声音的识别.实验结果表明交通环境特种声音在信噪比高于50dB的情况下,平均识别率高达96.67%,弥补了当前自动驾驶环境感知系统对于声学环境感知的缺失.