您现在的位置: 首页> 研究主题> 声音识别

声音识别

声音识别的相关文献在1990年到2022年内共计614篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、科学、科学研究 等领域,其中期刊论文231篇、会议论文9篇、专利文献257496篇;相关期刊184种,包括国际广告、环球科学、世界发明等; 相关会议5种,包括中国畜牧兽医学会信息技术分会第十届学术研讨会、第一届中国高校通信类院系学术研讨会、中国声学学会2007年青年学术会议等;声音识别的相关文献由1114位作者贡献,包括不公告发明人、丸田裕三、石井纯等。

声音识别—发文量

期刊论文>

论文:231 占比:0.09%

会议论文>

论文:9 占比:0.00%

专利文献>

论文:257496 占比:99.91%

总计:257736篇

声音识别—发文趋势图

声音识别

-研究学者

  • 不公告发明人
  • 丸田裕三
  • 石井纯
  • 坂下博纪
  • 山崎道弘
  • 竹里尚嘉
  • 野木和行
  • 铃木忠
  • 余星辰
  • 孙继平
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 江新奇; 刘敬玉; 李忠飞; 刘志华; 龙永祥
    • 摘要: 煤矿带式输送机运输系统人工巡检工作强度大,特别是大坡度带式输送机巡检易受落煤、飞石等影响,具有一定的危险性。因此,设计了煤矿悬挂式巡检机器人智能传感与控制系统,研究了系统整体架构和各类传感器布置方式,重点探讨了巡检机器人图像采集、语音识别、环境感知和无线通讯模块的功能设计和参数优化。开展了煤矿现场工业性试验,验证了机器人智能传感与控制系统性能,结果表明:该系统能够实现仪表数据识别、旋钮状态识别、胶带跑偏识别、火焰识别、声音检测、异常报警等功能,具备煤矿运输系统状态的地上、智能手机端的全面感知和实时监控能力。采用巡检机器人替人,可实现低温、粉尘、低照度等恶劣环境下的连续巡检作业,有效避免漏检、错检等问题。
    • 秦放; 曾维佳; 罗佳伟; 徐鹏
    • 摘要: 基于深度学习的方法,利用多模态信息融合技术,将汽车等目标的声音、图像信息融合,用于对测试目标的判断。利用改进Inception网络对图像识别技术展开研究,分别比较了单纯图像信息情况的辨识、单纯声音信息情况的辨识,以及多模态融合情况下的辨识。通过试验分析和比较,证明该方法可以有效提高用户的图像识别能力,将特种车辆的平均识别精确度提升到97%以上,可用于特种车辆紧急避让等情况,具有很好的应用价值。
    • 翟永杰; 彭雅妮; 杨旭; 胡东阳; 王新颖
    • 摘要: 为实现非接触式的电厂设备状态监测,文中提出一种将梅尔频率倒谱系数(MFCC)和翻转梅尔频率倒谱系数(IMFCC)两种特征中的部分特征联合作为特征参数,利用多分类支持向量机(SVM)进行参数分类的识别方法。该方法首先对数据集中的声音信号进行预处理操作;然后通过两种特征提取方法生成特征参数,计算生成两种特征每一维的类内均值和类间方差;最后根据阈值选择特征,对选择的两种特征进行线性叠加,从而得到融合特征。实验结果表明,在ESC-50部分数据集和电厂采集数据集上,相对于另外两种特征,融合特征维数更少,识别率更高,并且在训练样本较少的情况下能达到更好的分类效果。
    • 屈晓静; 林佳聪; 彭东城; 钟其麟
    • 摘要: 针对目前生活中普遍存在的老人和儿童独自在家发生意外时无法报警或报警不及时等问题,文中提出了一种基于卷积神经网络的语音识别报警系统。系统主要由GSM模块、麦克风阵列、树莓派和语音识别模块等组成。卷积神经网络能够在时间与空间上具有平移不变的卷积特点,因此可以对外界环境以及说话者的多样性进行克服性处理,提高语音识别率。实验证明,该报警系统方便快捷可靠,在室内环境中能对求救者的语音信号进行准确识别,并快速通知指定联系人,减少了紧急情况下无法及时报警带来的损失,对保护家庭成员的安全具有重要意义,可在家庭中推广使用。
    • 庞金生; 胡山; 张龙; 孙银斌; 陈伟涛; 杨鹏
    • 摘要: 当今时代,人类的乱砍滥伐造成生态环境恶化和温室效应加剧,对野生动物肆意捕杀将会加剧珍稀动物的灭绝速度。在进行森林保护和野生动物保护的过程中融入科学发展观念,能够有效地阻止非法采伐和捕杀野生动物的行为发生。基于深度学习与声音识别的护林系统,采用先进的深度学习技术[1],数据采集终端以回收的旧手机为核心,通过太阳能和风能为终端设备提供长时间的电能供应,符合可持续发展的建设理念[2]。
    • 王凯
    • 摘要: 我们遇见的第一天,医生告诉我说:现在的人工智能,最重要的不是智能,而是人工。当时我尚未涉足这一行,对他说的话似懂非懂。于是,他把我带到公司的最高一层,这里是识图AI的训练场,被分割成一个个隔音小房间,里面坐着来自附近城中村的女工们。她们或年老或年少,有些人握着鼠标的手尚且笨拙。一幅幅图片在屏幕上闪过,她们点击这些图片,对着麦克风大声读出这些图片里物件的名字。这些声音被收集起来,汇总到数据中心,变成一片小小的碎片,并会在下一个流程中化作支撑AI声音识别的一块砖瓦。
    • 纪楠; 尹艳玲; 沈维政; 寇胜利; 戴百生; 王国维
    • 摘要: 叫声是评估生猪福利水平的重要方式之一。本文首先分析了生猪叫声与福利之间的相互关系。其中,与生猪福利密切相关的三种生猪叫声包括咳嗽声、尖叫声和呼噜声。基于这三种声音进一步分析声音与环境,声音与身体状况,以及声音与健康之间的关系。随后,对当下的生猪福利监测所采用的传感器,包括穿戴式与非接触式两大类进行分析,并简述不同方式的优劣势。基于非接触式的优势及麦克风传感器技术的可行性,从声音的获取和标记、特征提取以及声音分类三个方面对现有的生猪声音处理技术进行了阐述和评估。最后,从声音监测技术、生猪个体福利监测、商业应用以及养猪从业者四个角度讨论了叫声在生猪福利监测中面临的研究困境以及发展趋势。研究发现,目前关于生猪声音分析的研究大多集中在分类器的选择和识别算法的改进上,而对端点检测和特征选择的研究较少。同时,当下面临的主要挑战还包括不同生长阶段的音频数据获取难度较高,缺乏公共的猪舍内音频数据库以及缺少完善的声音指标与动物福利监测评价体系。总体来说,建议进一步对声音识别过程中涉及的各部分技术进行深入探索,同时加强跨学科专家之间的合作,共同推动声音监测在生猪实际生产中的应用,从而加快精准畜牧业的实现。
    • 高磊; 刘振奎; 张昊宇; 魏晓悦; 张奎
    • 摘要: 隧道衬砌空洞敲击检查方法是目前铁路隧道中应用最多的检查方法,但其空洞识别和数据的记录均靠人工完成。为实现铁路隧道空洞敲击检查声音智能识别,将采集到的隧道敲击检查音频文件进行预处理,选取645个声音样本,提取24维梅尔频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)作为声音样本的声学特征参数,通过集成算法(梯度提升决策树GBDT)训练样本声学特征,建立隧道空洞敲击检查声音分类模型,最后将该模型应用于实际铁路隧道空洞敲击检查声音识别分类。实例研究表明:与优化的支持向量机(cross-validation-support vector machine,CV-SVM)模型和改进径向基神经网络(particle swarm optimization algorithm-radial basis function neural network,PSO-RBF)模型相比,GBDT集成算法模型具有更高的准确率和更少的运算时间,在面对异常数据时具有更强的稳定性,能够准确地根据铁路隧道空洞敲击检查声音诊断衬砌后是否存在空洞。
    • 高磊; 刘振奎; 魏晓悦; 张昊宇; 张奎
    • 摘要: 为实现铁路隧道二次衬砌背后空洞智能诊断,基于声音识别技术,建立隧道空洞敲击检查声音智能识别模型。收集645段检查锤敲击衬砌的声音样本,运用信号特征分析的基本方法,分析有空洞和无空洞状态下声音信号的时域和频域特征,并提取24维梅尔频率倒谱系数作为机器学习数据集。用主成分分析法降维,经混合粒子群算法优化的支持向量机训练后,建立铁路隧道空洞敲击检查声音智能识别模型,将该模型应用于实际铁路隧道验证其有效性。建立的声音识别模型训练时长为31 s,准确率达95.56%,且能准确对实际工程中的声音样本做出分类。研究结果表明:对2种状态下的声音样本时域特征和频域特征进行对比和分析,不同状态下短时能量和声纹都出现明显的不同。运用PCA-混合PSO-SVM建立的声音识别模型,有着较高的准确率和较快的训练速度,能够根据敲击检查声音准确判断出隧道背后是否存在空洞,如何根据声音特征判断衬砌背后空洞的大小和深度等,将是下一步研究的重点。目前铁路隧道快速无损检测还无法大范围普及,人工检查仍是使用最广泛的检查方法,通过研究敲击检查声音智能识别,为隧道智能化诊断做出新的探索,对加快人工检查速度、提高信息化程度和实现无纸化作业有着重要的意义。
    • 薛珊; 卫立炜; 顾宸瑜; 吕琼莹
    • 摘要: 针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(ECSANet)的无人机识别方法。首先,建立民用的9大类无人机声音数据集,提取数据集的对数梅尔谱图及其动态特征;其次,为了网络参数量少,避免过拟合,设计了基于分组卷积、通道混洗和残差结构的通道混洗多尺度分组卷积网络(MSSGNet);然后,为了能更多、更有效地提取无人机声音特征,设计了通道空间混合域注意力机制模块(ECSA);最后,将ECSA模块插入MSSGNet网络构成改进的通道空间混合域注意力机制的多尺度分组卷积网络(ECSANet),形成新型声音识别无人机的方法。运用设计的ECSANet网络对自建的民用无人机声音数据集和Urbansound8K环境声音数据集进行了声音识别,识别结果表明:与ResNet18、ResNet34、ResNeXt18和MobileNetV2等基准网络相比,MSSGNet网络参数更少,识别准确率更高,达到了95.1%;ECSA模块可以插入多种网络,在不增加很多参数的情况下令网络模型的识别准确率获得提升,在无人机等声音分类任务上具有很好的效果;与MSSGNet网络相比,改进的ECSANet网络识别准确率能达到95.9%,提高了0.8%,表明了该网络在识别小样本无人机方面的优越性和可行性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号