声学特征
声学特征的相关文献在1983年到2023年内共计363篇,主要集中在语言学、汉语、无线电电子学、电信技术
等领域,其中期刊论文214篇、会议论文71篇、专利文献67241篇;相关期刊177种,包括海外英语(上)、海外英语(中)、乐器等;
相关会议40种,包括第五届全国吞咽障碍高峰论坛、中国声学学会第十一届青年学术会议、中国电子学会电路与系统分会第二十六届年会等;声学特征的相关文献由892位作者贡献,包括张雪英、李爱军、艾斯卡尔·艾木都拉等。
声学特征—发文量
专利文献>
论文:67241篇
占比:99.58%
总计:67526篇
声学特征
-研究学者
- 张雪英
- 李爱军
- 艾斯卡尔·艾木都拉
- 黄昭鸣
- 吴东辉
- 周卫京
- 孙颖
- 王国民
- 陈阳
- 古力努尔·艾尔肯
- 吕士楠
- 吴忆来
- 崔效义
- 巴图格日勒
- 张卫
- 张超
- 彭永恒
- 李早元
- 李琳
- 李铮
- 殷治纲
- 洪青阳
- 王霞
- 蔡莲红
- 郑友志
- 郭小阳
- Askar Hamdulla
- B·Y·雅福索
- C·张
- D·M·洛克福德
- G·J·瑞德
- J·A·利珀特
- K·K·辛赫
- M·P·卡瑟博特
- N·马拉亚
- S·J·舒瓦塞尔
- S·K·波特
- S·斯里尼瓦桑
- T·J·舍普夫
- W·F·勒盖特
- X·周
- 万勤
- 乔纳森·纽兰德
- 于洪志
- 于珏
- 俞凯
- 冯亚琴
- 冯布洲
- 冯莹
- 刘加
-
-
杨海涛;
王华朋;
楚宪腾;
牛瑾琳;
张琨瑶
-
-
摘要:
为快速准确的识别公安工作中常见的伪造语音,采用深度卷积神经网络(Convolutional Neural Network,CNN)进行伪造语音检测。模型中卷积层可以有效获取声学信息,池化层进行下采样处理防止网络过拟合,全连接层则进行真伪分类。提取英文及中文数据库中音频文件的梅尔倒谱系数(Mel-Frequency Cepstral,MFCC)、线性频率倒谱系数(Linear Frequency Cepstral,LFCC)、伽玛通频率倒谱系数(Gammatone Frequency Ceptral Coefficient,GFCC)3种语音声学特征用于模型训练及测试。结果表明MFCC特征在该网络模型上结果最优,且在实验中所提神经网络对99%的伪造语音能够正确区分,在伪造语音检测中表现优秀。
-
-
郭毅波;
蔡鸣
-
-
摘要:
唇腭裂术后针对性的语音治疗是唇腭裂综合序列治疗的重要组成部分,主观语音评价是目前应用最广泛的评价体系,由于无法避免主观倾向的局限性,精准的腭裂语音诊疗仍有进一步完善的空间。随着医工交叉的广泛推进,计算机科学已成为前沿医疗的基石,人工智能在言语障碍领域已开展初步的临床应用。对于腭裂语音的计算机辅助识别和评价技术已有较多研究成果,辅音省略、咽擦音等代偿性发音错误是关键的识别分析特征,结合软硬件技术的系统能达到较高的识别准确度;但目前研究大多仅局限于独立的声学特征辨别,有待进一步开发多参数的分析函数来避免普遍评价的系统偏差;且计算机科学在腭裂语音评价及治疗方面仍缺乏治疗方案的尝试,在线诊疗平台未得到充分使用,因此运用人工智能媒介与主观评价体系的结合应是唇腭裂综合序列治疗的前景模式之一。
-
-
刘艳杰;
陈炳发;
丁力平
-
-
摘要:
针对微电机质量检测水平低、故障识别困难等问题,设计一种基于声学特征的微电机故障诊断方法。通过声音采集装置获得微电机转动时的正常声音信号和三种故障信号;从声音信号中提取39维梅尔频率倒谱系数和短时能量,搭建一维卷积神经网络模型进行识别。将声音信号转化成语谱图,建立二维卷积神经网络模型并识别。利用多模型融合技术中的加权平均算法将两个模型融合,融合后模型的准确率为93.58%,比单个模型平均提高2.43%。
-
-
耿浦洋;
卢启萌;
郭弘;
施少培;
卞新伟
-
-
摘要:
对于语音同一性鉴定,检材语音和样本语音具有可比性是开展鉴定的重要前提。为了对不同手机软件录音的可比性进行探索,对微信、抖音、花椒直播和录音机采集的语音信号进行了对比分析。研究发现,微信语音的有效频谱显示范围为0-8 kHz,抖音和花椒录制视频中音频信号为0-12 kHz,通过微信传输的视频中音频信号未见压缩或削减,微信、抖音、花椒直播等手机软件和录音机采集的语音信号的频谱特征在频率分布及走向、振幅强弱等特征,以及统计数据上均表现一致。研究说明不同手机软件录音与专业录音机录音具有可比性,均可用于语音同一性鉴定。
-
-
苗畅;
孟琪
-
-
摘要:
声景规划是提升城市开放空间的人居声环境的重要手段,然而以往的研究较少考虑行为对声景的影响。因此,文章从行为模式的视角出发,通过城市开放空间声级、声源感知和感知评价三个方面,分析了参与式行为和非参与式行为下城市开放空间中声景的差异。结果表明,城市开放空间中行为的声学特征可以分别用LAeq、LN和Lmax等指标表征;在声感知方面,非参与式行为人群的声景感知差异不大;与非参与式行为人群相比,参与声学行为的人群在声舒适度、愉悦度方面评价较高,而主观响度评价偏低;参与非声学行为人群在声舒适度、愉悦度方面评价较低,主观响度评价无显著差异。因此,可以从行为的声学特征出发,通过声景规划对空间进行设计,满足不同人群的声环境需求。
-
-
王怡;
王黎明;
柴玉梅
-
-
摘要:
语音情感识别已经成为下一代人机交互技术的重要组成部分,从语音信号中提取与情感相关的特征是语音情感识别的重要挑战.针对单一特征在情感识别中准确度不高的问题,该文提出了特征级-决策级融合的方法融合声学特征和语义特征进行情感识别.首先提取声学特征,包括:1)低层次手工特征集,包括基于谱相关、音质、能量、基频等相关特征,以及基于低层次特征的高级统计特征;2)DNN提取的谱相关特征的深度特征;3)CNN提取的基于Filter_bank特征的深度特征.并且使用基于Listen-Attend-Spell(LAS)模型的语音识别模块提取语义特征.然后将声学特征中的3类特征与语义特征进行特征级融合,在确定融合特征的先后顺序时引入了构造哈夫曼树的方法.最后得到融合后特征和原始4类特征各自的情感识别结果,在结果之上进行决策级融合,使用此方法在IEMOCAP数据集中分类准确度可达76.2%.
-
-
罗增勇;
杨艳
-
-
摘要:
小舌与软腭部位的清塞音有分布上互补或二者合并为软腭音的关系。按塞音的调音过程及其对后接元音的影响进程,分析桑孔语小舌和软腭送气、不送气清塞音的GAP和VOT特征、瞬时能量频谱和变化趋势,以及音轨方程和后接元音谐波能量差,发现桑孔语小舌软腭清塞音之间存在区别,但并不明显,而且小舌音有前移或软腭化的趋势。
-
-
于佳祺;
简志华;
徐嘉;
游林;
汪云路;
吴超
-
-
摘要:
为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢量,并与常数Q倒谱系数构成联合特征,再用所获得的联合特征矢量训练随机森林分类器,从而实现了伪装语音检测。实验中,分别对其他特征参数以及支持向量机分类器模型所构建的几种伪装检测系统进行了性能对照,结果表明,所提联合特征与随机森林模型相结合的语音伪装检测系统具有最优的检测性能。
-
-
韩伟伟;
郑奇;
张彬彬;
韩春杰;
谭振宙;
王晓光
-
-
摘要:
本文介绍了声学特征实现变压器的故障诊断的关键技术,通过采用实时分析变压器运行状态声信号的方法,定位变压器故障范围、判断运行趋势。实践结果表明,该方法相较于传统的人工巡检,故障发现的及时性和准确性皆大幅提升,同时具有声信号检测不受电场和磁场干扰、监测过程不影响变压器正常运行等优点。
-
-
刘文荣
-
-
摘要:
随着外来输入乐器以及新兴乐器在本域文化圈交流传播的不断扩大与普及,外来乐器文化以及新兴乐器名称有趋于稳固、覆盖以及“潜移默化”的统一,此即在世界乐器文化范围内形成的乐器同名异实之迹象。“洋琴”传入中国后,其两种早期译介虽托为“洋琴”之同名,但却为“锐上宽下”、与“一小锤与琴面键盘相连”两种乐器之实。本文对“洋琴”的同名异实及传入的本土化衍变进行名实考辨,对“洋琴”同名之由在声学特征上的异同表现进行细微分析阐述,并对乐器的同名异实现象及造成同名异实的原由进行分析与总结。
-
-
Liu Fengming;
刘凤鸣;
Chen Mo;
陈默
- 《第十二届全国语音学学术会议》
| 2016年
-
摘要:
韵律边界的声学特征是研究第二语言学习者韵律能力发展的重要维度.本研究以第一语言为韩语的汉语学习者的朗读产出为研究对象,以汉语母语者朗读韵律的基线数据作为参照,考察语言水平和韵律边界等级对韩语母语者汉语朗读韵律边界的声学特征产出的影响.研究结果表明:(1)韩语母语者在不同等级韵律边界处的各项声学特征的发展是不均衡的,低音点音高重置特征发展得最快,无声段时长和边界前音节延长特征发展得最慢.(2)不同语言水平的韩语母语者对于韵律边界声学特征层级关系的区分是不同的,这种能力的发展是动态的、非线性的:对于无声段时长特征来说,中级水平韩语母语者的表现最好,而初级和高级汉语水平韩语母语者表现较差;对于边界前延长特征来说,初级和高级汉语水平韩语母语者的表现较好,中级汉语水平韩语母语者的表现较差:对于低音点音高重置特征来说,韩语母语者对边界前音节为去声时低音点音高重置在各等级边界处的层级关系掌握得最好,其次是边界前音节为上声时的低音点音高重置层级关系,边界前音节为阳平时的低音点音高重置层级关系掌握得最不好.
-
-
LUO Min;
罗敏;
MENG Zi-hou;
孟子厚
- 《2016年全国声学学术会议》
| 2016年
-
摘要:
为了寻找更有效的记忆策略以提升人对声目标的学习记忆能力,通过快速记忆实验,考察声学特征与数序关联编码对记忆加工过程的影响.对照组未采用任何特殊记忆方法,两组数序组在学习记忆任务时呈现不同的数序关联编码信息,分析比较了三种学习条件下的实验数据.实验结果表明,数序编码信息能改善被试的心理操作,提升对记忆再认任务的辨别力,加快被试对学习项的信息提取时间;在选定的特征维度内,数字编码的排列顺序对实验结果没有产生显著差异.
-
-
-
-
-
-
Wu Yacen;
吴亚岑;
Lin Feng;
林枫;
Jiang Zhongli;
江钟立
- 《第五届全国吞咽障碍高峰论坛》
| 2017年
-
摘要:
目的:对比分析青年人和老年人的自发吞咽音特征.rn 方法:健康受试者100例,分为青年组(19~30岁)和老年组(60~85岁),每组50例(男女各25例).2组研究对象均测量颈围(绕甲状软骨水平的颈部周径)和体重指数(BMI).在甲状软骨以下气管左侧检测自发吞咽音20min,采用RavenPro1.5.0进行吞咽音切分、标注和吞咽声学指标测算,包括每分钟自发吞咽频率(SPM)、吞咽音长、能耗、半耗能时长及半耗能时长占比,使用R3.4.0进行统计分析.rn 结果:青年组的平均颈围(34.31±3.45)cm,与老年组[(33.95±3.00)cm]比较,差异无统计学意义(P=0.5789);青年组的BMI为(21.97±2.65)kg/m2,低于老年组[(23.43±2.89)kg/m2],组间差异有统计学意义(P=0.0219).老年组的SPM为(0.39±0.34)次/min,显著少于青年组[(0.91±0.51)次/min],且组间差异有统计学意义(P<0.01);老年组的吞咽音长为(0.92±0.29)s,显著长于青年组[(0.84±0.26)s],且组间差异有统计学意义(P<0.01);老年组单次吞咽消耗的能量为(76.88±9.82)dB,显著高于青年组[(75.43±8.93)dB],差异有统计学意义(P<0.05);老年组单次吞咽消耗一半能量所需时间为(0.43±0.24)s,显著长于青年组[(0.38±0.19)s],差异有统计学意义(P<0.01),但该时间占吞咽音长的比例在青年组[(48.30±28.20)%]和老年组[(49.00±29.90)%]之间差异无统计学意义(P=0.6859).rn 结论:与青年人相比,老年人的自发吞咽频率明显减少,吞咽音明显延长.
-
-
Wu Yacen;
吴亚岑;
Lin Feng;
林枫;
Jiang Zhongli;
江钟立
- 《第五届全国吞咽障碍高峰论坛》
| 2017年
-
摘要:
目的:对比分析青年人和老年人的自发吞咽音特征.rn 方法:健康受试者100例,分为青年组(19~30岁)和老年组(60~85岁),每组50例(男女各25例).2组研究对象均测量颈围(绕甲状软骨水平的颈部周径)和体重指数(BMI).在甲状软骨以下气管左侧检测自发吞咽音20min,采用RavenPro1.5.0进行吞咽音切分、标注和吞咽声学指标测算,包括每分钟自发吞咽频率(SPM)、吞咽音长、能耗、半耗能时长及半耗能时长占比,使用R3.4.0进行统计分析.rn 结果:青年组的平均颈围(34.31±3.45)cm,与老年组[(33.95±3.00)cm]比较,差异无统计学意义(P=0.5789);青年组的BMI为(21.97±2.65)kg/m2,低于老年组[(23.43±2.89)kg/m2],组间差异有统计学意义(P=0.0219).老年组的SPM为(0.39±0.34)次/min,显著少于青年组[(0.91±0.51)次/min],且组间差异有统计学意义(P<0.01);老年组的吞咽音长为(0.92±0.29)s,显著长于青年组[(0.84±0.26)s],且组间差异有统计学意义(P<0.01);老年组单次吞咽消耗的能量为(76.88±9.82)dB,显著高于青年组[(75.43±8.93)dB],差异有统计学意义(P<0.05);老年组单次吞咽消耗一半能量所需时间为(0.43±0.24)s,显著长于青年组[(0.38±0.19)s],差异有统计学意义(P<0.01),但该时间占吞咽音长的比例在青年组[(48.30±28.20)%]和老年组[(49.00±29.90)%]之间差异无统计学意义(P=0.6859).rn 结论:与青年人相比,老年人的自发吞咽频率明显减少,吞咽音明显延长.
-
-
Wu Yacen;
吴亚岑;
Lin Feng;
林枫;
Jiang Zhongli;
江钟立
- 《第五届全国吞咽障碍高峰论坛》
| 2017年
-
摘要:
目的:对比分析青年人和老年人的自发吞咽音特征.rn 方法:健康受试者100例,分为青年组(19~30岁)和老年组(60~85岁),每组50例(男女各25例).2组研究对象均测量颈围(绕甲状软骨水平的颈部周径)和体重指数(BMI).在甲状软骨以下气管左侧检测自发吞咽音20min,采用RavenPro1.5.0进行吞咽音切分、标注和吞咽声学指标测算,包括每分钟自发吞咽频率(SPM)、吞咽音长、能耗、半耗能时长及半耗能时长占比,使用R3.4.0进行统计分析.rn 结果:青年组的平均颈围(34.31±3.45)cm,与老年组[(33.95±3.00)cm]比较,差异无统计学意义(P=0.5789);青年组的BMI为(21.97±2.65)kg/m2,低于老年组[(23.43±2.89)kg/m2],组间差异有统计学意义(P=0.0219).老年组的SPM为(0.39±0.34)次/min,显著少于青年组[(0.91±0.51)次/min],且组间差异有统计学意义(P<0.01);老年组的吞咽音长为(0.92±0.29)s,显著长于青年组[(0.84±0.26)s],且组间差异有统计学意义(P<0.01);老年组单次吞咽消耗的能量为(76.88±9.82)dB,显著高于青年组[(75.43±8.93)dB],差异有统计学意义(P<0.05);老年组单次吞咽消耗一半能量所需时间为(0.43±0.24)s,显著长于青年组[(0.38±0.19)s],差异有统计学意义(P<0.01),但该时间占吞咽音长的比例在青年组[(48.30±28.20)%]和老年组[(49.00±29.90)%]之间差异无统计学意义(P=0.6859).rn 结论:与青年人相比,老年人的自发吞咽频率明显减少,吞咽音明显延长.
-
-
Wu Yacen;
吴亚岑;
Lin Feng;
林枫;
Jiang Zhongli;
江钟立
- 《第五届全国吞咽障碍高峰论坛》
| 2017年
-
摘要:
目的:对比分析青年人和老年人的自发吞咽音特征.rn 方法:健康受试者100例,分为青年组(19~30岁)和老年组(60~85岁),每组50例(男女各25例).2组研究对象均测量颈围(绕甲状软骨水平的颈部周径)和体重指数(BMI).在甲状软骨以下气管左侧检测自发吞咽音20min,采用RavenPro1.5.0进行吞咽音切分、标注和吞咽声学指标测算,包括每分钟自发吞咽频率(SPM)、吞咽音长、能耗、半耗能时长及半耗能时长占比,使用R3.4.0进行统计分析.rn 结果:青年组的平均颈围(34.31±3.45)cm,与老年组[(33.95±3.00)cm]比较,差异无统计学意义(P=0.5789);青年组的BMI为(21.97±2.65)kg/m2,低于老年组[(23.43±2.89)kg/m2],组间差异有统计学意义(P=0.0219).老年组的SPM为(0.39±0.34)次/min,显著少于青年组[(0.91±0.51)次/min],且组间差异有统计学意义(P<0.01);老年组的吞咽音长为(0.92±0.29)s,显著长于青年组[(0.84±0.26)s],且组间差异有统计学意义(P<0.01);老年组单次吞咽消耗的能量为(76.88±9.82)dB,显著高于青年组[(75.43±8.93)dB],差异有统计学意义(P<0.05);老年组单次吞咽消耗一半能量所需时间为(0.43±0.24)s,显著长于青年组[(0.38±0.19)s],差异有统计学意义(P<0.01),但该时间占吞咽音长的比例在青年组[(48.30±28.20)%]和老年组[(49.00±29.90)%]之间差异无统计学意义(P=0.6859).rn 结论:与青年人相比,老年人的自发吞咽频率明显减少,吞咽音明显延长.