声音识别
声音识别的相关文献在1990年到2022年内共计614篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、科学、科学研究
等领域,其中期刊论文231篇、会议论文9篇、专利文献257496篇;相关期刊184种,包括国际广告、环球科学、世界发明等;
相关会议5种,包括中国畜牧兽医学会信息技术分会第十届学术研讨会、第一届中国高校通信类院系学术研讨会、中国声学学会2007年青年学术会议等;声音识别的相关文献由1114位作者贡献,包括不公告发明人、丸田裕三、石井纯等。
声音识别—发文量
专利文献>
论文:257496篇
占比:99.91%
总计:257736篇
声音识别
-研究学者
- 不公告发明人
- 丸田裕三
- 石井纯
- 坂下博纪
- 山崎道弘
- 竹里尚嘉
- 野木和行
- 铃木忠
- 余星辰
- 孙继平
- 董政
- 井上让
- 冈田玲子
- 卫立炜
- 原田将治
- 古贺敏之
- 宫崎敏幸
- 小沼知浩
- 小金井智弘
- 山本大介
- 张志鹏
- 曾丽
- 李晓东
- 海老原充
- 石川泰
- 神田直之
- 薛珊
- 住吉悠希
- 吕琼莹
- 大泽政信
- 孙倩倩
- 张吉
- 张强
- 张驰
- 徐立章
- 曹永胜
- 朱俊
- 李兴文
- 李耀明
- 梁振伟
- 王克强
- 袁文浩
- 邓涛
- 马路
- 马锬
- M·S·彼德森
- 丁武俊
- 中岛悠辅
- 中岛拓也
- 丸本彻
-
-
江新奇;
刘敬玉;
李忠飞;
刘志华;
龙永祥
-
-
摘要:
煤矿带式输送机运输系统人工巡检工作强度大,特别是大坡度带式输送机巡检易受落煤、飞石等影响,具有一定的危险性。因此,设计了煤矿悬挂式巡检机器人智能传感与控制系统,研究了系统整体架构和各类传感器布置方式,重点探讨了巡检机器人图像采集、语音识别、环境感知和无线通讯模块的功能设计和参数优化。开展了煤矿现场工业性试验,验证了机器人智能传感与控制系统性能,结果表明:该系统能够实现仪表数据识别、旋钮状态识别、胶带跑偏识别、火焰识别、声音检测、异常报警等功能,具备煤矿运输系统状态的地上、智能手机端的全面感知和实时监控能力。采用巡检机器人替人,可实现低温、粉尘、低照度等恶劣环境下的连续巡检作业,有效避免漏检、错检等问题。
-
-
秦放;
曾维佳;
罗佳伟;
徐鹏
-
-
摘要:
基于深度学习的方法,利用多模态信息融合技术,将汽车等目标的声音、图像信息融合,用于对测试目标的判断。利用改进Inception网络对图像识别技术展开研究,分别比较了单纯图像信息情况的辨识、单纯声音信息情况的辨识,以及多模态融合情况下的辨识。通过试验分析和比较,证明该方法可以有效提高用户的图像识别能力,将特种车辆的平均识别精确度提升到97%以上,可用于特种车辆紧急避让等情况,具有很好的应用价值。
-
-
翟永杰;
彭雅妮;
杨旭;
胡东阳;
王新颖
-
-
摘要:
为实现非接触式的电厂设备状态监测,文中提出一种将梅尔频率倒谱系数(MFCC)和翻转梅尔频率倒谱系数(IMFCC)两种特征中的部分特征联合作为特征参数,利用多分类支持向量机(SVM)进行参数分类的识别方法。该方法首先对数据集中的声音信号进行预处理操作;然后通过两种特征提取方法生成特征参数,计算生成两种特征每一维的类内均值和类间方差;最后根据阈值选择特征,对选择的两种特征进行线性叠加,从而得到融合特征。实验结果表明,在ESC-50部分数据集和电厂采集数据集上,相对于另外两种特征,融合特征维数更少,识别率更高,并且在训练样本较少的情况下能达到更好的分类效果。
-
-
屈晓静;
林佳聪;
彭东城;
钟其麟
-
-
摘要:
针对目前生活中普遍存在的老人和儿童独自在家发生意外时无法报警或报警不及时等问题,文中提出了一种基于卷积神经网络的语音识别报警系统。系统主要由GSM模块、麦克风阵列、树莓派和语音识别模块等组成。卷积神经网络能够在时间与空间上具有平移不变的卷积特点,因此可以对外界环境以及说话者的多样性进行克服性处理,提高语音识别率。实验证明,该报警系统方便快捷可靠,在室内环境中能对求救者的语音信号进行准确识别,并快速通知指定联系人,减少了紧急情况下无法及时报警带来的损失,对保护家庭成员的安全具有重要意义,可在家庭中推广使用。
-
-
庞金生;
胡山;
张龙;
孙银斌;
陈伟涛;
杨鹏
-
-
摘要:
当今时代,人类的乱砍滥伐造成生态环境恶化和温室效应加剧,对野生动物肆意捕杀将会加剧珍稀动物的灭绝速度。在进行森林保护和野生动物保护的过程中融入科学发展观念,能够有效地阻止非法采伐和捕杀野生动物的行为发生。基于深度学习与声音识别的护林系统,采用先进的深度学习技术[1],数据采集终端以回收的旧手机为核心,通过太阳能和风能为终端设备提供长时间的电能供应,符合可持续发展的建设理念[2]。
-
-
王凯
-
-
摘要:
我们遇见的第一天,医生告诉我说:现在的人工智能,最重要的不是智能,而是人工。当时我尚未涉足这一行,对他说的话似懂非懂。于是,他把我带到公司的最高一层,这里是识图AI的训练场,被分割成一个个隔音小房间,里面坐着来自附近城中村的女工们。她们或年老或年少,有些人握着鼠标的手尚且笨拙。一幅幅图片在屏幕上闪过,她们点击这些图片,对着麦克风大声读出这些图片里物件的名字。这些声音被收集起来,汇总到数据中心,变成一片小小的碎片,并会在下一个流程中化作支撑AI声音识别的一块砖瓦。
-
-
纪楠;
尹艳玲;
沈维政;
寇胜利;
戴百生;
王国维
-
-
摘要:
叫声是评估生猪福利水平的重要方式之一。本文首先分析了生猪叫声与福利之间的相互关系。其中,与生猪福利密切相关的三种生猪叫声包括咳嗽声、尖叫声和呼噜声。基于这三种声音进一步分析声音与环境,声音与身体状况,以及声音与健康之间的关系。随后,对当下的生猪福利监测所采用的传感器,包括穿戴式与非接触式两大类进行分析,并简述不同方式的优劣势。基于非接触式的优势及麦克风传感器技术的可行性,从声音的获取和标记、特征提取以及声音分类三个方面对现有的生猪声音处理技术进行了阐述和评估。最后,从声音监测技术、生猪个体福利监测、商业应用以及养猪从业者四个角度讨论了叫声在生猪福利监测中面临的研究困境以及发展趋势。研究发现,目前关于生猪声音分析的研究大多集中在分类器的选择和识别算法的改进上,而对端点检测和特征选择的研究较少。同时,当下面临的主要挑战还包括不同生长阶段的音频数据获取难度较高,缺乏公共的猪舍内音频数据库以及缺少完善的声音指标与动物福利监测评价体系。总体来说,建议进一步对声音识别过程中涉及的各部分技术进行深入探索,同时加强跨学科专家之间的合作,共同推动声音监测在生猪实际生产中的应用,从而加快精准畜牧业的实现。
-
-
高磊;
刘振奎;
张昊宇;
魏晓悦;
张奎
-
-
摘要:
隧道衬砌空洞敲击检查方法是目前铁路隧道中应用最多的检查方法,但其空洞识别和数据的记录均靠人工完成。为实现铁路隧道空洞敲击检查声音智能识别,将采集到的隧道敲击检查音频文件进行预处理,选取645个声音样本,提取24维梅尔频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)作为声音样本的声学特征参数,通过集成算法(梯度提升决策树GBDT)训练样本声学特征,建立隧道空洞敲击检查声音分类模型,最后将该模型应用于实际铁路隧道空洞敲击检查声音识别分类。实例研究表明:与优化的支持向量机(cross-validation-support vector machine,CV-SVM)模型和改进径向基神经网络(particle swarm optimization algorithm-radial basis function neural network,PSO-RBF)模型相比,GBDT集成算法模型具有更高的准确率和更少的运算时间,在面对异常数据时具有更强的稳定性,能够准确地根据铁路隧道空洞敲击检查声音诊断衬砌后是否存在空洞。
-
-
高磊;
刘振奎;
魏晓悦;
张昊宇;
张奎
-
-
摘要:
为实现铁路隧道二次衬砌背后空洞智能诊断,基于声音识别技术,建立隧道空洞敲击检查声音智能识别模型。收集645段检查锤敲击衬砌的声音样本,运用信号特征分析的基本方法,分析有空洞和无空洞状态下声音信号的时域和频域特征,并提取24维梅尔频率倒谱系数作为机器学习数据集。用主成分分析法降维,经混合粒子群算法优化的支持向量机训练后,建立铁路隧道空洞敲击检查声音智能识别模型,将该模型应用于实际铁路隧道验证其有效性。建立的声音识别模型训练时长为31 s,准确率达95.56%,且能准确对实际工程中的声音样本做出分类。研究结果表明:对2种状态下的声音样本时域特征和频域特征进行对比和分析,不同状态下短时能量和声纹都出现明显的不同。运用PCA-混合PSO-SVM建立的声音识别模型,有着较高的准确率和较快的训练速度,能够根据敲击检查声音准确判断出隧道背后是否存在空洞,如何根据声音特征判断衬砌背后空洞的大小和深度等,将是下一步研究的重点。目前铁路隧道快速无损检测还无法大范围普及,人工检查仍是使用最广泛的检查方法,通过研究敲击检查声音智能识别,为隧道智能化诊断做出新的探索,对加快人工检查速度、提高信息化程度和实现无纸化作业有着重要的意义。
-
-
薛珊;
卫立炜;
顾宸瑜;
吕琼莹
-
-
摘要:
针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(ECSANet)的无人机识别方法。首先,建立民用的9大类无人机声音数据集,提取数据集的对数梅尔谱图及其动态特征;其次,为了网络参数量少,避免过拟合,设计了基于分组卷积、通道混洗和残差结构的通道混洗多尺度分组卷积网络(MSSGNet);然后,为了能更多、更有效地提取无人机声音特征,设计了通道空间混合域注意力机制模块(ECSA);最后,将ECSA模块插入MSSGNet网络构成改进的通道空间混合域注意力机制的多尺度分组卷积网络(ECSANet),形成新型声音识别无人机的方法。运用设计的ECSANet网络对自建的民用无人机声音数据集和Urbansound8K环境声音数据集进行了声音识别,识别结果表明:与ResNet18、ResNet34、ResNeXt18和MobileNetV2等基准网络相比,MSSGNet网络参数更少,识别准确率更高,达到了95.1%;ECSA模块可以插入多种网络,在不增加很多参数的情况下令网络模型的识别准确率获得提升,在无人机等声音分类任务上具有很好的效果;与MSSGNet网络相比,改进的ECSANet网络识别准确率能达到95.9%,提高了0.8%,表明了该网络在识别小样本无人机方面的优越性和可行性。
-
-
刘振宇;
赫晓燕;
桑静;
李玉婷;
武志强;
路志明
- 《中国畜牧兽医学会信息技术分会第十届学术研讨会》
| 2015年
-
摘要:
针对猪患呼吸道或肺部疾病难以被发现的问题,对猪患病时发出的咳嗽声音进行了研究,提出了基于HMM的猪咳嗽声音识别方案.用语音信号的HMM状态数进行研究猪咳嗽声,通过解决识别性问题、确定观察字符序列匹配的状态序列以及模型训练问题,对猪咳嗽声音做出识别和分析,实现对猪患呼吸疾病的诊断.经过大型养猪场试验验证表明,利用此方案能有效且快速的识别猪咳嗽声音,对猪病情的判断提供重要的信息.
-
-
-
苗浩;
李晓东;
田静
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究在传感器网络中多个地面车辆同时出现的情况下,通过独立分量分析的方法,把它们的卷积混合信号分离为单独的声源信号,在保持了混合前信号的频谱特征的前提下,使得信号的信噪比提高了21dB左右,为下一步的分类算法打下了基础。
-
-
苗浩;
李晓东;
田静
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究在传感器网络中多个地面车辆同时出现的情况下,通过独立分量分析的方法,把它们的卷积混合信号分离为单独的声源信号,在保持了混合前信号的频谱特征的前提下,使得信号的信噪比提高了21dB左右,为下一步的分类算法打下了基础。
-
-
苗浩;
李晓东;
田静
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究在传感器网络中多个地面车辆同时出现的情况下,通过独立分量分析的方法,把它们的卷积混合信号分离为单独的声源信号,在保持了混合前信号的频谱特征的前提下,使得信号的信噪比提高了21dB左右,为下一步的分类算法打下了基础。
-
-
苗浩;
李晓东;
田静
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究在传感器网络中多个地面车辆同时出现的情况下,通过独立分量分析的方法,把它们的卷积混合信号分离为单独的声源信号,在保持了混合前信号的频谱特征的前提下,使得信号的信噪比提高了21dB左右,为下一步的分类算法打下了基础。
-
-
苗浩;
李晓东;
田静
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究在传感器网络中多个地面车辆同时出现的情况下,通过独立分量分析的方法,把它们的卷积混合信号分离为单独的声源信号,在保持了混合前信号的频谱特征的前提下,使得信号的信噪比提高了21dB左右,为下一步的分类算法打下了基础。
-
-
王景彬;
阎兆立;
程晓斌
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究针对多任务模式所引发的竞争同步问题,从任务调度和通信机制出发,使用优先级设置保证系统对任务的快速响应,使用信号量和消息队列保证任务间的协调通信。另外,消息队列的缓冲机制保证了数据传输的可靠性。实际运行表明,在无人值守的情况下,该系统可长时间连续稳定运行,具有很高的可靠性和稳定性。
-
-
王景彬;
阎兆立;
程晓斌
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究针对多任务模式所引发的竞争同步问题,从任务调度和通信机制出发,使用优先级设置保证系统对任务的快速响应,使用信号量和消息队列保证任务间的协调通信。另外,消息队列的缓冲机制保证了数据传输的可靠性。实际运行表明,在无人值守的情况下,该系统可长时间连续稳定运行,具有很高的可靠性和稳定性。
-
-
王景彬;
阎兆立;
程晓斌
- 《中国声学学会2007年青年学术会议》
| 2007年
-
摘要:
本研究针对多任务模式所引发的竞争同步问题,从任务调度和通信机制出发,使用优先级设置保证系统对任务的快速响应,使用信号量和消息队列保证任务间的协调通信。另外,消息队列的缓冲机制保证了数据传输的可靠性。实际运行表明,在无人值守的情况下,该系统可长时间连续稳定运行,具有很高的可靠性和稳定性。
-
-
-
-
- 宁波方太厨具有限公司
- 公开公告日期:2021.01.15
-
摘要:
本发明涉及一种声音识别方法,对声音采样信号X进行一阶差分计算,获取一阶差分数据组Y,进而将一阶差分数据组Y中各一阶差分数据yj与一阶差分数据阈值yth进行比较计算而获取一阶差分特征数据组VY=[v1,v2,...,vj,...vn],获取一阶差分特征数据组中vj=K2的序号数据组,进而获取待识别声音信号的识别特征向量V,将该待识别声音信号的识别特征向量V与声音模板特征向量Vsam进行契合度比较计算,进而确定待识别的声音信号内容。该声音识别方法能够有效减少数据处理量。本发明还涉及一种应用有该声音识别方法的吸油烟机的控制方法,吸油烟机根据识别的声音内容对吸油烟机进行操作控制。该吸油烟机的自动控制方法的声音识别性能好、成本低。
-
-
-
-
-
-
-