您现在的位置: 首页> 研究主题> 语音识别

语音识别

语音识别的相关文献在1983年到2023年内共计11026篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、语言学 等领域,其中期刊论文4689篇、会议论文614篇、专利文献294049篇;相关期刊1392种,包括电声技术、电子设计工程、数据采集与处理等; 相关会议311种,包括第十二届全国人机语言通讯学术会议(NCMMSC`2013)、中国科学院声学研究所第四届青年学术交流会、第十一届全国人机语音通讯学术会议等;语音识别的相关文献由17662位作者贡献,包括颜永红、不公告发明人、徐波等。

语音识别—发文量

期刊论文>

论文:4689 占比:1.57%

会议论文>

论文:614 占比:0.21%

专利文献>

论文:294049 占比:98.23%

总计:299352篇

语音识别—发文趋势图

语音识别

-研究学者

  • 颜永红
  • 不公告发明人
  • 徐波
  • 王作英
  • 张雪英
  • 韩纪庆
  • 杜利民
  • 刘加
  • 潘接林
  • 贾磊
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 陈艳; 李图雅; 马志强; 谢秀兰; 王洪彬
    • 摘要: 蒙古语声学模型的训练过程是模型学习发音数据与标注数据之间关系的一个过程。针对以音素为建模粒子的蒙古语声学模型建模,由于蒙古语词的发音与语义存在一对多映射现象,会造成解码出的蒙古语文本错误,进而导致蒙古语语音识别系统识别率降低的问题。对此,该文以端到端模型为基础,以蒙古语音素、字母为蒙古语声学模型建模粒子,设计了基于BLSTM-CTC的蒙古语声学模型,并给出了动量训练算法。实验结果表明,基于蒙古语字母的BLSTM-CTC蒙古语声学模型可以有效降低蒙古语语音识别系统中异形同音词的词错率。
    • 张锋; 陶浩兵; 慕京生; 刘东阳; 辜丽川; 焦俊
    • 摘要: 人的语音具有一定的上下文相关性,传统语音识别模型对历史信息记忆能力不足,无法充分学习语音序列的相关性。根据人对机器人控制的语音特点,设计了一种基于双向长短时记忆(Bi-LSTM)网络的控制机器人的语音识别模型,并在自己制作的语音库中训练,优化了模型参数。实验结果表明:远端控制命令通过语音识别模型转化为控制命令,传送到机器人的人际交互系统,较好地完成了人对机器人发出的运动控制、状态反馈和环境监测的任务,控制机器人命令语音识别的准确率达到80%以上。
    • 王心雨; 单杏花; 景辉
    • 摘要: 为了解决老年人网上购票困难的问题,通过智能语音识别技术的运用,实现铁路12306手机客户端语音购票功能,降低老年人网上购票的操作门槛。目前语音识别算法的准确率已经达到较高水平,但是通用的语音识别方法存在铁路专有名词识别困难的问题。针对此,提出融合铁路专有知识的语音识别方法,使用多重语言模型共同修正声学模型的解码结果;增加前缀束搜索的解码方法,提高解码过程中的召回率;设计的热词赋权模块,配置包含铁路专有名词的热词库,提高专有名词的检出率。在自建数据集上进行对比实验,结果表明,提出的基于多重语言模型融合的铁路购票语音识别方法能准确识别铁路专有名词,达到90%以上的识别准确率。
    • 徐璐; 赵从朴; 朱雯; 孙国强; 朱卫国
    • 摘要: 目的将语音识别技术应用于口腔科电子病历系统,及时、准确记录口腔电子病历,提高临床工作效率。方法基于海量医学文本数据及医学音频数据,开发多模态智能语音口腔电子病历系统。结果实现了基于语音识别技术的口腔电子病历系统与通用电子病历系统的无缝衔接,有效减轻医生工作强度,提升工作效率。结论根据口腔科诊疗中需要对患者进行操作的特点,将语音识别技术融入口腔电子病历系统中,可辅助临床诊疗工作,提高病历书写质量。
    • 徐秋平; 任玲; 樊玺炫; 王义华
    • 摘要: 语音识别技术在城市轨道交通自动售检票系统中还未全面推广应用,多数仍为试点运行,未从线网层进行整体规划建设。文章通过全方位研究语音识别技术在自动售检票系统中应用的业务流程、功能需求、关键技术和系统架构,论证得出语音识别技术在城市轨道交通中的应用推广具有积极意义。
    • 干璐; 南昊天; 王诗敏; 陈琦同; 马涛; 曹顺良
    • 摘要: "声纳"智能物品查询系统(以下简称:该系统)从物品管理功能需求出发,基于语音识别技术,重点研究该领域发展现状、受众需求模型及实用功能设计,研究智能语音识别技术及应用,拟实现通过使用智能语音助手,以语音答辩的形式快速查找、获得物品存放位置及信息。项目创新点在于突破传统查询及管理模式,语音对话实现录入及查找操作,解放双手。
    • 张学文; 王林; 冯夫健; 谭棉; 李学林
    • 摘要: 苗语作为西南少数民族的主要语种之一,其语音研究存在语言文字缺失、语音语料库不健全、地域差异等问题,因此苗语的语音识别难度较大。针对语音语料库不健全的问题,借助汉语拼音对苗语语音进行标注,构建不同地域的苗语语音语料库。基于拼音媒介传递的思想,设计苗语孤立词汇识别模型,该模型利用卷积神经网络对提取的语音特征进行训练和测试,解决了文字缺失情况下的苗语孤立词语音识别问题。为验证该模型的有效性和稳定性,以自建苗语语音语料库的数据作为实验数据集,分别在同地域、不同地域以及组合地域语音数据集上进行验证实验。实验结果表明,所提模型对苗语孤立词语音识别有效,同地域语音识别效果优于不同地域识别效果,在组合地域语音识别中表现亦良好。
    • 雷神
    • 摘要: 运算器、控制器、存储器、输入设备和输出设备是计算机硬件的五个组成部分。每个部分都随着技术的发展而发展:芯片变得越来越小,功能越来越强大;显示器的分辨率越来越高;输入的方式也增加了触屏和语音识别等;而存储器的变化似乎更大……今天,我们就来聊一聊存储器的发展。电脑的存储器分为内部存储器和外部存储器。我们先来说说内部存储器的发展。
    • 温伍正宏; 潘甦; 张坤
    • 摘要: 近年来,现代信息技术进入高速发展的阶段,新的研究成果出现的同时也带来了新的难题和挑战,其中,对人工智能的研究应用到了人们生活和生产的各个方面,给社会生活带来了巨大的改变。在人工智能识别中的语音识别研究一直是重点研究项目,虽然基于人工神经网络引入声学理论的研究,让语音识别智能化的效率和准确率大大提高,但是随着对语音识别需求的增多,仍然出现了一些不足。因此需要基于大数据和深度学习,对语音识别进行改善和深入研究,本文通过探讨语言智能识别的现状,用基于大数据和深度学习的方法,改善语音识别中的语音提取,声音模拟和识别判断等,有效提高语音识别技术的发展。
    • 于重重; 吴佳佳; 陈运兵; 钱兆鹏
    • 摘要: 土家语是一种典型的濒危语言,因其母语人少、无文字、仅以口语形式存在等低资源性,很难典藏大量带标注的语音,导致其消亡速度日益加快,因此挽救和保护濒危语言迫在眉睫。针对上述问题,建立了一种基于多头注意力机制的端到端濒危语言语音识别模型。通过语音时域伸缩技术(time-scale-modification,TSM)改变土家语口语词汇语速对其进行扩充,有效解决了土家语语料不足的问题;建立基于注意力机制的端到端模型Listen,Attend,and Spell(LAS)实现土家语的自动语音识别功能;针对LAS模型中解码器状态向量与编码器状态向量对齐精度不高的问题,引入了多头注意力机制以提高模型的识别准确率。实验结果表明,多头注意力机制通过关注不同位置的空间信息能有效提升模型的表征能力,较传统注意力机制模型识别率提升了4.76%。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号