您现在的位置: 首页> 研究主题> 语谱图

语谱图

语谱图的相关文献在1990年到2022年内共计187篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、基础医学 等领域,其中期刊论文130篇、会议论文8篇、专利文献52812篇;相关期刊83种,包括改革与开放、中国传媒大学学报(自然科学版)、云南民族大学学报(自然科学版)等; 相关会议6种,包括第一届全国声像资料检验鉴定技术交流会、第七届全国信号与信息处理联合会议暨首届全国省(市)级图象图形学会联合年会、第九届全国人机语言通讯学术会议等;语谱图的相关文献由481位作者贡献,包括王双维、梁士利、潘迪等。

语谱图—发文量

期刊论文>

论文:130 占比:0.25%

会议论文>

论文:8 占比:0.02%

专利文献>

论文:52812 占比:99.74%

总计:52950篇

语谱图—发文趋势图

语谱图

-研究学者

  • 王双维
  • 梁士利
  • 潘迪
  • 许廷发
  • 魏莹
  • 李亚桐
  • 王杰
  • 伏娟
  • 刘同来
  • 张玲
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 张玉杰; 张赞
    • 摘要: 为了提高声纹识别技术的识别性能,将DenseNet应用于语谱图实现声纹识别,从提高网络的运算效率和增强声纹特征的表征能力2个方面对DenseNet进行优化,提出采用深度可分离卷积来减少网络的参数量,以及增加中心损失函数项来提高声纹特征的表征能力。从训练结果可以看出,通过深度可分离卷积,网络的参数量减少了25.5%,模型大小减少了24.6%;从仿真结果可以看出,中心损失项的增加使声纹特征的聚类效果更加明显,提高了声纹特征的表征能力。因此,改进后的DenseNet在语谱图声纹识别领域取得了好的识别效果。
    • 柏文展; 程汪鑫
    • 摘要: 语谱图主要用于研究语音信号不同频段的信号强度随时间变化的关系。分析语谱图时,需要利用Python语言和相关库进行仿真,得到语音信号的伪彩色映射并将结果直观地显示出来,便于进一步分析、研究语音信号的特征。本文讨论语音信号的声学基础和有关特征,分析语音信号处理的发展及应用,用声卡采集湖南三个地方的方言语音信号,利用Python语言对方言语音信号语谱图进行显示,分析不同汉语方言之间的差异。该方法具有编程简单、相关功能库丰富、对设备要求低、显示结果直观等特点,为分析处理不同地区的方言语音信号提供了一种简洁高效的方法。调用Python进行仿真,能清晰地分辨出宽带信号与窄带信号的不同特性,因此可通过对频谱图的分析来识别不同地方的方言。
    • 欧昀; 周晓彦; 李大鹏
    • 摘要: 为了解决高校深度学习教学活动中缺乏实际案例演示的问题,设计了利用卷积神经网络(CNN)进行鸟声识别的实验。对已有常见鸟声数据库中的鸟鸣声音频进行梅尔倒谱系数(MFCC)特征提取,利用短时傅里叶变换(STFT)结果绘制出STFT语谱图,利用Python在TensorFlow框架下构建卷积神经网络的鸟声识别系统。实验过程中既可利用MFCC和STFT语谱图中2种特征参数分别在各自训练好的网络模型下进行对比实验,也可作为创新性实验,由学生自行编程设计CNN模型实现鸟声识别,通过识别结果验证模型的优劣。
    • 赵千倩; 顾祥玉; 陈静; 李晖; 余雨
    • 摘要: 随着国家全面二孩政策的开放,婴幼儿的监护面临着巨大挑战,基于信息通信技术的婴幼儿监护系统受到广泛关注和应用,通过对婴幼儿的啼哭声进行情绪识别显得尤为重要。文章基于语谱图的婴啼特征分析与识别算法,可对婴幼儿在不同情况下包括睡醒、换尿布、要拥抱、饥饿、要睡觉、不舒服进行特征分析和识别。结果表明,婴幼儿在各种状态下的哭声语频谱都有明显差异,在语谱图的形态、哭声基频、第一共振峰的频率等方面均有显著不同,实现对婴幼儿不同情绪状态的识别。文章提出的算法可极大增强婴幼儿监护系统中的婴啼情绪识别功能。
    • 贾嘉敏; 潘文林
    • 摘要: 为更有效地对低资源少数民族语言进行语音识别研究,提出一种SE-Block与Inception_Resnet_v2相结合的深度神经网络模型。该模型引入Inception结构提取语谱图特征,同时引入SE-Block增强网络对特征维度的信息通道选择能力,优化网络性能。实验结果表明,相比其他主流模型,该模型在提高模型精度与训练收敛速度的同时,增强了网络的整体学习能力。实验在佤语数据集上取得良好的学习效果,验证了该模型在数据样本数量有限的低资源少数民族语音识别中的高效性。
    • 甘宏
    • 摘要: 随着语音识别和自然语言处理技术的成熟,智能语音技术逐步落地到各行各业,但目前智能语音产品缺乏情感的交互,未实现真正的智能。为了提升智能语音产品的拟人性,学术界对语音情感识别的研究热度越来越高,但是多局限在使用传统特征工程以及通用深度学习模型上。在应用深度学习模型的基础上引入注意力机制对语音情感识别展开研究,选用语谱图作为输入特征,并对CNN输出的特征进行通道维度的注意力关注,分析注意力计算过程中不同池化方式对识别结果的影响,并引入残差,提升模型表现力,最终UA实现了2.83%的提升。
    • 李兴; 朱苏青; 刘松林
    • 摘要: 在目前油田生产信息化系统条件下,中心控制室对抽油机设备的故障监控、发现与预警的手段和方法较少,仅能通过视频的方式进行巡回检查。针对当前现状,开展抽油机故障音频及预警技术研究与应用,利用物联网、机器学习、大数据分析等技术,实现连续性的设备监控,及时、精准地发现和诊断抽油机机械故障并预警,避免机械事故的发生,减轻员工的劳动强度,提高设备信息化管理水平。
    • 董安明; 刘宗银; 禹继国; 韩玉冰; 周酉
    • 摘要: 随着网络音乐产业的快速发展,构筑音乐自动检索和分类系统的需求日益增加。利用计算机对音乐流派进行正确标注是实现音乐类型精准分类和保障音乐推荐系统性能的重要前提。针对卷积运算不具备提取全局表征的能力,深度卷积神经网络对音乐流派数据的全局建模能力较弱的问题,提出了一种基于视觉变换(ViT)神经网络的音乐流派自动分类方法。该方法对待分类的音频进行预处理后,利用短时傅里叶变换(STFT)转化为尺寸统一的语谱图切片,实现音乐频域特征的转换。为了避免训练过拟合,通过增加白噪声对语谱图切片集进行数据增强。然后利用所生成的语谱切片集及其增强后的数据集对所构建的ViT神经网络进行训练,从而实现音乐流派风格的自动分类。仿真结果表明,所构建的ViT网络在音乐流派分类公共数据集GTZAN上的测试识别准确率达到91.01%,比基于AlexNet、AlexNet-enhanced和VGG16等传统卷积神经网络(CNN)的音乐流派分类方法提升了1.00~5.00个百分点。
    • 吾买尔江·麦麦提; 阿布都热孜克·热孜克
    • 摘要: 本文通过介绍广播电台日常业务工作中的广播信号监测技术,结合当前广播信号监测技术手段以及其存在的缺点、发展方向,通过语音信号监测技术与广播信号监测工作相结合,提出了基于调制频谱的广播信号监测方法。
    • 王鹏; 周成成; 吴文琪; 唐依静; 孙世凡
    • 摘要: 音频的应用现已遍及家庭生活,社会宣传以及一些司法的领域,但随着语音合成技术的不断发展,音源数据的采集和开发,现实网络中已出现多种合成音,因此音频的真实性已无法得到充分的保证。针对音频在发生篡改、拼接等情况时,在语谱图的基础上,对音频信号进行音频取证,提出一种通过Python对音频信号进行预处理,分帧、加窗,并计算统计每一帧中的高频分量占比,通过分析占比波形来达到音频篡改检测的目的,验证音频的真实性和可靠性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号