您现在的位置: 首页> 研究主题> 声学特征

声学特征

声学特征的相关文献在1983年到2023年内共计363篇,主要集中在语言学、汉语、无线电电子学、电信技术 等领域,其中期刊论文214篇、会议论文71篇、专利文献67241篇;相关期刊177种,包括海外英语(上)、海外英语(中)、乐器等; 相关会议40种,包括第五届全国吞咽障碍高峰论坛、中国声学学会第十一届青年学术会议、中国电子学会电路与系统分会第二十六届年会等;声学特征的相关文献由892位作者贡献,包括张雪英、李爱军、艾斯卡尔·艾木都拉等。

声学特征—发文量

期刊论文>

论文:214 占比:0.32%

会议论文>

论文:71 占比:0.11%

专利文献>

论文:67241 占比:99.58%

总计:67526篇

声学特征—发文趋势图

声学特征

-研究学者

  • 张雪英
  • 李爱军
  • 艾斯卡尔·艾木都拉
  • 黄昭鸣
  • 吴东辉
  • 周卫京
  • 孙颖
  • 王国民
  • 陈阳
  • 古力努尔·艾尔肯
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 杨海涛; 王华朋; 楚宪腾; 牛瑾琳; 张琨瑶
    • 摘要: 为快速准确的识别公安工作中常见的伪造语音,采用深度卷积神经网络(Convolutional Neural Network,CNN)进行伪造语音检测。模型中卷积层可以有效获取声学信息,池化层进行下采样处理防止网络过拟合,全连接层则进行真伪分类。提取英文及中文数据库中音频文件的梅尔倒谱系数(Mel-Frequency Cepstral,MFCC)、线性频率倒谱系数(Linear Frequency Cepstral,LFCC)、伽玛通频率倒谱系数(Gammatone Frequency Ceptral Coefficient,GFCC)3种语音声学特征用于模型训练及测试。结果表明MFCC特征在该网络模型上结果最优,且在实验中所提神经网络对99%的伪造语音能够正确区分,在伪造语音检测中表现优秀。
    • 郭毅波; 蔡鸣
    • 摘要: 唇腭裂术后针对性的语音治疗是唇腭裂综合序列治疗的重要组成部分,主观语音评价是目前应用最广泛的评价体系,由于无法避免主观倾向的局限性,精准的腭裂语音诊疗仍有进一步完善的空间。随着医工交叉的广泛推进,计算机科学已成为前沿医疗的基石,人工智能在言语障碍领域已开展初步的临床应用。对于腭裂语音的计算机辅助识别和评价技术已有较多研究成果,辅音省略、咽擦音等代偿性发音错误是关键的识别分析特征,结合软硬件技术的系统能达到较高的识别准确度;但目前研究大多仅局限于独立的声学特征辨别,有待进一步开发多参数的分析函数来避免普遍评价的系统偏差;且计算机科学在腭裂语音评价及治疗方面仍缺乏治疗方案的尝试,在线诊疗平台未得到充分使用,因此运用人工智能媒介与主观评价体系的结合应是唇腭裂综合序列治疗的前景模式之一。
    • 刘艳杰; 陈炳发; 丁力平
    • 摘要: 针对微电机质量检测水平低、故障识别困难等问题,设计一种基于声学特征的微电机故障诊断方法。通过声音采集装置获得微电机转动时的正常声音信号和三种故障信号;从声音信号中提取39维梅尔频率倒谱系数和短时能量,搭建一维卷积神经网络模型进行识别。将声音信号转化成语谱图,建立二维卷积神经网络模型并识别。利用多模型融合技术中的加权平均算法将两个模型融合,融合后模型的准确率为93.58%,比单个模型平均提高2.43%。
    • 耿浦洋; 卢启萌; 郭弘; 施少培; 卞新伟
    • 摘要: 对于语音同一性鉴定,检材语音和样本语音具有可比性是开展鉴定的重要前提。为了对不同手机软件录音的可比性进行探索,对微信、抖音、花椒直播和录音机采集的语音信号进行了对比分析。研究发现,微信语音的有效频谱显示范围为0-8 kHz,抖音和花椒录制视频中音频信号为0-12 kHz,通过微信传输的视频中音频信号未见压缩或削减,微信、抖音、花椒直播等手机软件和录音机采集的语音信号的频谱特征在频率分布及走向、振幅强弱等特征,以及统计数据上均表现一致。研究说明不同手机软件录音与专业录音机录音具有可比性,均可用于语音同一性鉴定。
    • 苗畅; 孟琪
    • 摘要: 声景规划是提升城市开放空间的人居声环境的重要手段,然而以往的研究较少考虑行为对声景的影响。因此,文章从行为模式的视角出发,通过城市开放空间声级、声源感知和感知评价三个方面,分析了参与式行为和非参与式行为下城市开放空间中声景的差异。结果表明,城市开放空间中行为的声学特征可以分别用LAeq、LN和Lmax等指标表征;在声感知方面,非参与式行为人群的声景感知差异不大;与非参与式行为人群相比,参与声学行为的人群在声舒适度、愉悦度方面评价较高,而主观响度评价偏低;参与非声学行为人群在声舒适度、愉悦度方面评价较低,主观响度评价无显著差异。因此,可以从行为的声学特征出发,通过声景规划对空间进行设计,满足不同人群的声环境需求。
    • 王怡; 王黎明; 柴玉梅
    • 摘要: 语音情感识别已经成为下一代人机交互技术的重要组成部分,从语音信号中提取与情感相关的特征是语音情感识别的重要挑战.针对单一特征在情感识别中准确度不高的问题,该文提出了特征级-决策级融合的方法融合声学特征和语义特征进行情感识别.首先提取声学特征,包括:1)低层次手工特征集,包括基于谱相关、音质、能量、基频等相关特征,以及基于低层次特征的高级统计特征;2)DNN提取的谱相关特征的深度特征;3)CNN提取的基于Filter_bank特征的深度特征.并且使用基于Listen-Attend-Spell(LAS)模型的语音识别模块提取语义特征.然后将声学特征中的3类特征与语义特征进行特征级融合,在确定融合特征的先后顺序时引入了构造哈夫曼树的方法.最后得到融合后特征和原始4类特征各自的情感识别结果,在结果之上进行决策级融合,使用此方法在IEMOCAP数据集中分类准确度可达76.2%.
    • 罗增勇; 杨艳
    • 摘要: 小舌与软腭部位的清塞音有分布上互补或二者合并为软腭音的关系。按塞音的调音过程及其对后接元音的影响进程,分析桑孔语小舌和软腭送气、不送气清塞音的GAP和VOT特征、瞬时能量频谱和变化趋势,以及音轨方程和后接元音谐波能量差,发现桑孔语小舌软腭清塞音之间存在区别,但并不明显,而且小舌音有前移或软腭化的趋势。
    • 于佳祺; 简志华; 徐嘉; 游林; 汪云路; 吴超
    • 摘要: 为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢量,并与常数Q倒谱系数构成联合特征,再用所获得的联合特征矢量训练随机森林分类器,从而实现了伪装语音检测。实验中,分别对其他特征参数以及支持向量机分类器模型所构建的几种伪装检测系统进行了性能对照,结果表明,所提联合特征与随机森林模型相结合的语音伪装检测系统具有最优的检测性能。
    • 韩伟伟; 郑奇; 张彬彬; 韩春杰; 谭振宙; 王晓光
    • 摘要: 本文介绍了声学特征实现变压器的故障诊断的关键技术,通过采用实时分析变压器运行状态声信号的方法,定位变压器故障范围、判断运行趋势。实践结果表明,该方法相较于传统的人工巡检,故障发现的及时性和准确性皆大幅提升,同时具有声信号检测不受电场和磁场干扰、监测过程不影响变压器正常运行等优点。
    • 刘文荣
    • 摘要: 随着外来输入乐器以及新兴乐器在本域文化圈交流传播的不断扩大与普及,外来乐器文化以及新兴乐器名称有趋于稳固、覆盖以及“潜移默化”的统一,此即在世界乐器文化范围内形成的乐器同名异实之迹象。“洋琴”传入中国后,其两种早期译介虽托为“洋琴”之同名,但却为“锐上宽下”、与“一小锤与琴面键盘相连”两种乐器之实。本文对“洋琴”的同名异实及传入的本土化衍变进行名实考辨,对“洋琴”同名之由在声学特征上的异同表现进行细微分析阐述,并对乐器的同名异实现象及造成同名异实的原由进行分析与总结。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号