语音识别
语音识别的相关文献在1983年到2023年内共计11026篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、语言学
等领域,其中期刊论文4689篇、会议论文614篇、专利文献294049篇;相关期刊1392种,包括电声技术、电子设计工程、数据采集与处理等;
相关会议311种,包括第十二届全国人机语言通讯学术会议(NCMMSC`2013)、中国科学院声学研究所第四届青年学术交流会、第十一届全国人机语音通讯学术会议等;语音识别的相关文献由17662位作者贡献,包括颜永红、不公告发明人、徐波等。
语音识别—发文量
专利文献>
论文:294049篇
占比:98.23%
总计:299352篇
语音识别
-研究学者
- 颜永红
- 不公告发明人
- 徐波
- 王作英
- 张雪英
- 韩纪庆
- 杜利民
- 刘加
- 潘接林
- 贾磊
- 李稀敏
- 胡光锐
- 刘润生
- 朱杰
- 王仁华
- 肖龙源
- 刘刚
- 刘晓葳
- 张鹏远
- 李明
- 钱彦旻
- 韦岗
- 戴礼荣
- 吴及
- 苏丹
- 赵力
- 吴镇扬
- 屈丹
- 李健
- 胡郁
- 张磊
- 景新幸
- 李杰
- 王健宗
- 白静
- 胡国平
- 赵鹤鸣
- 郭军
- 陈伟
- 陈孝良
- 谢湘
- 刘庆峰
- 张鹏
- 徐明星
- 杨康
- 陈芒
- 刘文举
- 岳志毅
- 张杰
- 张毅
-
-
陈艳;
李图雅;
马志强;
谢秀兰;
王洪彬
-
-
摘要:
蒙古语声学模型的训练过程是模型学习发音数据与标注数据之间关系的一个过程。针对以音素为建模粒子的蒙古语声学模型建模,由于蒙古语词的发音与语义存在一对多映射现象,会造成解码出的蒙古语文本错误,进而导致蒙古语语音识别系统识别率降低的问题。对此,该文以端到端模型为基础,以蒙古语音素、字母为蒙古语声学模型建模粒子,设计了基于BLSTM-CTC的蒙古语声学模型,并给出了动量训练算法。实验结果表明,基于蒙古语字母的BLSTM-CTC蒙古语声学模型可以有效降低蒙古语语音识别系统中异形同音词的词错率。
-
-
张锋;
陶浩兵;
慕京生;
刘东阳;
辜丽川;
焦俊
-
-
摘要:
人的语音具有一定的上下文相关性,传统语音识别模型对历史信息记忆能力不足,无法充分学习语音序列的相关性。根据人对机器人控制的语音特点,设计了一种基于双向长短时记忆(Bi-LSTM)网络的控制机器人的语音识别模型,并在自己制作的语音库中训练,优化了模型参数。实验结果表明:远端控制命令通过语音识别模型转化为控制命令,传送到机器人的人际交互系统,较好地完成了人对机器人发出的运动控制、状态反馈和环境监测的任务,控制机器人命令语音识别的准确率达到80%以上。
-
-
王心雨;
单杏花;
景辉
-
-
摘要:
为了解决老年人网上购票困难的问题,通过智能语音识别技术的运用,实现铁路12306手机客户端语音购票功能,降低老年人网上购票的操作门槛。目前语音识别算法的准确率已经达到较高水平,但是通用的语音识别方法存在铁路专有名词识别困难的问题。针对此,提出融合铁路专有知识的语音识别方法,使用多重语言模型共同修正声学模型的解码结果;增加前缀束搜索的解码方法,提高解码过程中的召回率;设计的热词赋权模块,配置包含铁路专有名词的热词库,提高专有名词的检出率。在自建数据集上进行对比实验,结果表明,提出的基于多重语言模型融合的铁路购票语音识别方法能准确识别铁路专有名词,达到90%以上的识别准确率。
-
-
徐璐;
赵从朴;
朱雯;
孙国强;
朱卫国
-
-
摘要:
目的将语音识别技术应用于口腔科电子病历系统,及时、准确记录口腔电子病历,提高临床工作效率。方法基于海量医学文本数据及医学音频数据,开发多模态智能语音口腔电子病历系统。结果实现了基于语音识别技术的口腔电子病历系统与通用电子病历系统的无缝衔接,有效减轻医生工作强度,提升工作效率。结论根据口腔科诊疗中需要对患者进行操作的特点,将语音识别技术融入口腔电子病历系统中,可辅助临床诊疗工作,提高病历书写质量。
-
-
徐秋平;
任玲;
樊玺炫;
王义华
-
-
摘要:
语音识别技术在城市轨道交通自动售检票系统中还未全面推广应用,多数仍为试点运行,未从线网层进行整体规划建设。文章通过全方位研究语音识别技术在自动售检票系统中应用的业务流程、功能需求、关键技术和系统架构,论证得出语音识别技术在城市轨道交通中的应用推广具有积极意义。
-
-
干璐;
南昊天;
王诗敏;
陈琦同;
马涛;
曹顺良
-
-
摘要:
"声纳"智能物品查询系统(以下简称:该系统)从物品管理功能需求出发,基于语音识别技术,重点研究该领域发展现状、受众需求模型及实用功能设计,研究智能语音识别技术及应用,拟实现通过使用智能语音助手,以语音答辩的形式快速查找、获得物品存放位置及信息。项目创新点在于突破传统查询及管理模式,语音对话实现录入及查找操作,解放双手。
-
-
张学文;
王林;
冯夫健;
谭棉;
李学林
-
-
摘要:
苗语作为西南少数民族的主要语种之一,其语音研究存在语言文字缺失、语音语料库不健全、地域差异等问题,因此苗语的语音识别难度较大。针对语音语料库不健全的问题,借助汉语拼音对苗语语音进行标注,构建不同地域的苗语语音语料库。基于拼音媒介传递的思想,设计苗语孤立词汇识别模型,该模型利用卷积神经网络对提取的语音特征进行训练和测试,解决了文字缺失情况下的苗语孤立词语音识别问题。为验证该模型的有效性和稳定性,以自建苗语语音语料库的数据作为实验数据集,分别在同地域、不同地域以及组合地域语音数据集上进行验证实验。实验结果表明,所提模型对苗语孤立词语音识别有效,同地域语音识别效果优于不同地域识别效果,在组合地域语音识别中表现亦良好。
-
-
-
温伍正宏;
潘甦;
张坤
-
-
摘要:
近年来,现代信息技术进入高速发展的阶段,新的研究成果出现的同时也带来了新的难题和挑战,其中,对人工智能的研究应用到了人们生活和生产的各个方面,给社会生活带来了巨大的改变。在人工智能识别中的语音识别研究一直是重点研究项目,虽然基于人工神经网络引入声学理论的研究,让语音识别智能化的效率和准确率大大提高,但是随着对语音识别需求的增多,仍然出现了一些不足。因此需要基于大数据和深度学习,对语音识别进行改善和深入研究,本文通过探讨语言智能识别的现状,用基于大数据和深度学习的方法,改善语音识别中的语音提取,声音模拟和识别判断等,有效提高语音识别技术的发展。
-
-
于重重;
吴佳佳;
陈运兵;
钱兆鹏
-
-
摘要:
土家语是一种典型的濒危语言,因其母语人少、无文字、仅以口语形式存在等低资源性,很难典藏大量带标注的语音,导致其消亡速度日益加快,因此挽救和保护濒危语言迫在眉睫。针对上述问题,建立了一种基于多头注意力机制的端到端濒危语言语音识别模型。通过语音时域伸缩技术(time-scale-modification,TSM)改变土家语口语词汇语速对其进行扩充,有效解决了土家语语料不足的问题;建立基于注意力机制的端到端模型Listen,Attend,and Spell(LAS)实现土家语的自动语音识别功能;针对LAS模型中解码器状态向量与编码器状态向量对齐精度不高的问题,引入了多头注意力机制以提高模型的识别准确率。实验结果表明,多头注意力机制通过关注不同位置的空间信息能有效提升模型的表征能力,较传统注意力机制模型识别率提升了4.76%。
-
-
王晟
- 《2018(13th)中国卫生信息技术/健康医疗大数据应用交流大会》
| 2018年
-
摘要:
目的:探索智能语音识别技术在门诊电子病历中的应用.方法:在我院搭建智能语音识别私有云平台,采集大量我院的医疗数据和医生的语音数据等,通过深度学习技术,全面优化语音识别引擎.结果:智能语音识别准确率达97%,在我院门诊正式应用,有效提升医生的工作效率.结论:语音识别技术在医疗领域有良好的应用前景,但需要在抗噪性、敏感性、稳定性以及地方口音的识别方面进一步提升,深度融合与语音助手是语音识别应用的发展方向,将实现语音识别在医疗领域更广泛、更深入的应用.
-
-
-
SUNAOKA Kazuko;
砂冈和子
- 《第十一届中文教学现代化国际研讨会》
| 2018年
-
摘要:
近几年,随着智能语言技术不断的发展,不仅不同语种之间文本互译准确程度大幅提升,口语的实时互译已经出现.智能语言技术将减少跨语言交流的障碍,可为人们带来诸多方便.同时包括外语教学对相关行业造成冲击.本文使用非母语者(NNS)与母语者(NS)之间进行群体远程讨论会的真实话料,对比验证了语音识别(Automatic Speech Recognition,ASR)对NS与NNS语音的识别精度差异.分析结果发现最新ASR对单一发言人,母语者、标准口语的识别度非常高,已达到现场应用的水平.但不管对NS还是NNS,凡是对于含有情感语音的ASR识别率出现大幅下降.因此很难应用到远场(far-field)、多通道(multi-channel)、多模态(multi-modal)的语音识别领域.相比之下,讨论课参与人员语义协商过程的记录告诉,语料里虽然存在部分词汇发音模糊,语句碎片化的问题,但是大家利用多通道、多模态的渠道交换副语言与非语言信息,成功实现了沟通与互动.此研究有助于区分技术的局限性与人的互动能力和想象力.
-
-
刘文生
- 《第八届中国市县医院“云”论坛》
| 2020年
-
摘要:
传统的诊疗场景正在发生变化,在门诊诊室内,除医患双方外,可能还会有一个"第三者".不是医生助手,也不是患者家属,而是一个类似平板的智能机器人.依托声学处理、语音识别、知识图谱、对话理解、文本生成等技术,它可以替医生准确书写出一份完整的电子病历.它就是左手医生推出的最新AI产品——诊室听译机器人.
-
-
LI Tao;
李涛;
CAO Hui;
曹辉;
GUO Le-le;
郭乐乐
- 《2018中国西部声学学术交流会》
| 2018年
-
摘要:
为了提升连续语音识别系统性能,将深度自编码器神经网络应用于语音信号特征提取.通过堆叠稀疏自编码器组成深度自编码器(Deep Auto-Encoding,DAE),经过预训练和微调两个步骤提取语音信号的本质特征,使用与上下文相关的三音素模型,以音素错误率大小为系统性能的评判标准.仿真结果表明相对于传统梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)特征以及优化后的MFCC特征,基于深度自编码器提取的深度特征更具优越性.
-
-
-
冯一军;
蓝彩霞;
黎志坤;
欧镇丽
- 《广西测绘学会2018年学术交流会》
| 2018年
-
摘要:
近年来,中国北斗卫星导航系统得到了快速发展,测量型北斗接收机已被广泛应用到测绘领域.北斗智能RTK测量手簿是辅助于实时动态定位而产生的,手簿的各项功能的适用性将影响野外数据采集的工作效率.本文拟采用语音识别技术、太阳能电池技术、数据加密技术、北斗系统特有的短报文发送功能,对传统的北斗RTK测量手簿进行优化设计,有效提高北斗RTK外业测量数据采集和内业绘图的工作效率,使其能够满足用户实际生产的需要.
-
-
史亚楠;
代天文
- 《第十五届河南省汽车工程科技学术研讨会》
| 2019年
-
摘要:
车载语音即汽车上的语音助手,用来进行人机交互,实现对车辆的语音控制.目前,语音助手在智能家居、教育、手机等产业已经并取得了不俗的成绩;在汽车产业中语音助手也已初露锋芒.车载语音将成为衡量智能汽车的标杆,是汽车迈进智能驾驶的第一步.
-
-
史亚楠;
代天文
- 《第十五届河南省汽车工程科技学术研讨会》
| 2019年
-
摘要:
车载语音即汽车上的语音助手,用来进行人机交互,实现对车辆的语音控制.目前,语音助手在智能家居、教育、手机等产业已经并取得了不俗的成绩;在汽车产业中语音助手也已初露锋芒.车载语音将成为衡量智能汽车的标杆,是汽车迈进智能驾驶的第一步.
-
-
史亚楠;
代天文
- 《第十五届河南省汽车工程科技学术研讨会》
| 2019年
-
摘要:
车载语音即汽车上的语音助手,用来进行人机交互,实现对车辆的语音控制.目前,语音助手在智能家居、教育、手机等产业已经并取得了不俗的成绩;在汽车产业中语音助手也已初露锋芒.车载语音将成为衡量智能汽车的标杆,是汽车迈进智能驾驶的第一步.