自动语音识别
自动语音识别的相关文献在1996年到2022年内共计189篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、教育
等领域,其中期刊论文71篇、会议论文13篇、专利文献1628884篇;相关期刊62种,包括西部广播电视、现代教育技术、中国传媒大学学报(自然科学版)等;
相关会议11种,包括第十二届全国人机语言通讯学术会议(NCMMSC`2013)、第九届全国人机语言通讯学术会议、第一届中国高校通信类院系学术研讨会等;自动语音识别的相关文献由425位作者贡献,包括J·W·凯尔、K·A·博尔顿、P·M·卢茨等。
自动语音识别—发文量
专利文献>
论文:1628884篇
占比:99.99%
总计:1628968篇
自动语音识别
-研究学者
- J·W·凯尔
- K·A·博尔顿
- P·M·卢茨
- 张连海
- A·辛格
- G.塔尔瓦
- G·施特默尔
- L·库里洛
- M·克里斯纳莫尔泰
- M·鲍立克
- X.赵
- 俞栋
- 克里斯多福·帕金森
- 刘聪
- 史帝芬·A.·庞博
- 大卫·哈利克
- 彼塔尔·阿列克西克
- 朴春俊
- 杨保顶
- 杰佛瑞·J.·贾寇伯森
- 牛铜
- 薛嘉宾
- 詹姆士·伍达尔
- 邹铮贤
- 郑贵滨
- 郑铁然
- 韩纪庆
- 颜永红
- A·菲舍尔
- A·阿塞罗
- B·J·皮克林
- B·T·斯塔尼福德
- C·J·斯特里克林
- D·苏瑞史
- G·塔瓦尔
- G·斯特摩尔
- J·奥费
- J·田
- M.F.R.乔扈里
- M·惠特伯恩
- P·K·阿卡拉普
- P·毛
- R.D.辛斯三世
- R·D·比普斯
- R·古拉班尼
- S·史蒂芬妮
- S·西瓦苏布拉马尼亚
- T·D·波尔特尼
- V·S·安巴扎甘
- V·朱可夫
-
-
吴迪
-
-
摘要:
为了解决非英语母语学习者在语音识别中出现的语法错误问题,提出了基于神经机器翻译的语法错误检测语音识别中的语言模型。将构建的语言模型与传统的语言模型进行了比较,分析了该语言模型算法在语法错误检测中的性能。结果显示,由于神经机器翻译具有特定的内部结构,可以结合上下文信息进行语音识别,神经机器翻译模型可以更好地进行语法错误检测。通过比较不同语言模型结果,该方法比基于规则的方法有显著优势,神经机器翻译语言模型的精度、召回率、F值分别为0.54、0.52、0.53,证明了该模型具有较好的性能。
-
-
刁艳侠
-
-
摘要:
我们正处在以智能制造为主导的第四次工业革命的浪潮中,随着人工智能、信息技术、生物技术等新兴技术的兴起,制造业进入到了全面智能化转型时期。如何让机器设备变得更加智能,为人类提供更舒适便捷的服务,就成为人们不断探索的课题。语言交流是人与人沟通的基础,自然而然地,智能语音就成为人与机器交互的一个重要载体。在智能电视领域,随着技术升级和应用场景的不断拓展,智能语音已经成为智能电视的核心能力之一,在人机交互中占据了越来越重要的地位。为了提升语音整体性能及业务能力,各大厂家不再满足于第三方语音技术方案提供的整套服务,开始加大对智能语音全链路的研发投入,以便对语音功能有更多优化和选择的空间。而在智能语音的整个链路中,云端控制和决策能力又是至关重要的一环,所以搭建私有化中控平台,成为各大厂家优先选择的方案。
-
-
姚永波;
焦小龙;
王晓波
-
-
摘要:
为提高智能电网调度控制系统中语音识别的准确性,提出一种基于格拉姆角场(Gramian Angular Field,GAF)和深度残差网络(Deep Residual Network,DRN)的电力调度语音识别方法。首先利用GAF中的格拉姆角差场和格拉姆角和场两种方法将一维时间序列语音信号转化为二维特征图像;然后采用DRN对语音信号的二维特征图像进行特征提取和识别模型建立。采用实际电力调度语音信号对模型进行训练及测试,结果表明,该模型可有效识别电力调度语音,识别准确率超过99%。
-
-
许永武;
邹金池;
赵时
-
-
摘要:
随着媒体深度融合不断推进,各类新兴媒体持续涌现、遍地开花,广播电视内容监测从传统的广播、电视频道监测扩展到了互联网新兴媒体视听内容.海量、多元的互联网视听内容给监测监管工作带来了巨大的挑战,如何适应这一新形势是各级监管机构面临的共性问题.本文旨在探讨将自动语音识别和智能语义分析技术结合起来应用到监测监管工作中的可行性及优势.
-
-
杨媛;
李诗铭;
陈昌勇;
叶舟;
李杰
-
-
摘要:
为了降低自动语音识别中深度学习的训练成本,提出了一种有效的基于梯度的主动学习询问策略.主动学习是通过一定算法查询出最"有用"的数据,并交给专家标记这些子集的过程,其关键是如何正确选择出"有价值"的样本集.根据预备实验结果,在理想状态下,真实的梯度长度可以最大程度地衡量样本信息量,提出了同时使用不确定性策略和期望梯度长度策略在神经网络中去逼近真实梯度长度的算法.验证结果表明,当应用于基于音素的语音识别系统时,提出的混合策略性能优于传统单一的主动学习查询方法,在噪声和安静环境中都获得了更快的收敛速度和更多的损失抑制.
-
-
-
-
戴鸿高
-
-
摘要:
苏州有线网络智慧广电融合支撑平台,以有线网络AI智能终端为载体,引入语音识别、智能分析等先进技术和互联网生态,设计服务于苏州市域智慧业务,以探索提升有线网络传播能力、服务能力、创新能力,占领有线网络业发展的战略新高地.
-
-
许永武;
邹金池;
赵时
-
-
摘要:
随着媒体深度融合不断推进,各类新兴媒体持续涌现、遍地开花,广播电视内容监测从传统的广播、电视频道监测扩展到了互联网新兴媒体视听内容。海量、多元的互联网视听内容给监测监管工作带来了巨大的挑战,如何适应这一新形势是各级监管机构面临的共性问题。本文旨在探讨将自动语音识别和智能语义分析技术结合起来应用到监测监管工作中的可行性及优势。
-
-
-
-
-
-
-
-
-
Xiangang Li;
李先刚;
Chengwei Zhang;
张晨炜;
Zaihu Pang;
庞在虎;
Xihong Wu;
吴玺宏
- 《第十二届全国人机语言通讯学术会议(NCMMSC`2013)》
| 2013年
-
摘要:
本文针对动态扩展解码空间的大词汇量连续语音识别解码器的优化展开研究工作.在不改变识别结果的条件下,分别从声学模型似然打分,词尾语言模型得分查找,语言模型look-ahead得分计算三个方面入手,采用了SSE、GPU加速,非保序完美哈希,静态的look-ahead得分表等方法.特别地,针对静态的look-ahead得分表的方法,提出了基于文法词历史中词的联合概率进行筛选的策略.实验证明上述方法能够在一定程度上提高解码速度,综合使用上述方法,能够使得系统由2.0倍实时提高到约1.3倍实时.
-
-
Xiangang Li;
李先刚;
Chengwei Zhang;
张晨炜;
Zaihu Pang;
庞在虎;
Xihong Wu;
吴玺宏
- 《第十二届全国人机语言通讯学术会议(NCMMSC`2013)》
| 2013年
-
摘要:
本文针对动态扩展解码空间的大词汇量连续语音识别解码器的优化展开研究工作.在不改变识别结果的条件下,分别从声学模型似然打分,词尾语言模型得分查找,语言模型look-ahead得分计算三个方面入手,采用了SSE、GPU加速,非保序完美哈希,静态的look-ahead得分表等方法.特别地,针对静态的look-ahead得分表的方法,提出了基于文法词历史中词的联合概率进行筛选的策略.实验证明上述方法能够在一定程度上提高解码速度,综合使用上述方法,能够使得系统由2.0倍实时提高到约1.3倍实时.
-
-
Xiangang Li;
李先刚;
Chengwei Zhang;
张晨炜;
Zaihu Pang;
庞在虎;
Xihong Wu;
吴玺宏
- 《第十二届全国人机语言通讯学术会议(NCMMSC`2013)》
| 2013年
-
摘要:
本文针对动态扩展解码空间的大词汇量连续语音识别解码器的优化展开研究工作.在不改变识别结果的条件下,分别从声学模型似然打分,词尾语言模型得分查找,语言模型look-ahead得分计算三个方面入手,采用了SSE、GPU加速,非保序完美哈希,静态的look-ahead得分表等方法.特别地,针对静态的look-ahead得分表的方法,提出了基于文法词历史中词的联合概率进行筛选的策略.实验证明上述方法能够在一定程度上提高解码速度,综合使用上述方法,能够使得系统由2.0倍实时提高到约1.3倍实时.
-
-
Xiangang Li;
李先刚;
Chengwei Zhang;
张晨炜;
Zaihu Pang;
庞在虎;
Xihong Wu;
吴玺宏
- 《第十二届全国人机语言通讯学术会议(NCMMSC`2013)》
| 2013年
-
摘要:
本文针对动态扩展解码空间的大词汇量连续语音识别解码器的优化展开研究工作.在不改变识别结果的条件下,分别从声学模型似然打分,词尾语言模型得分查找,语言模型look-ahead得分计算三个方面入手,采用了SSE、GPU加速,非保序完美哈希,静态的look-ahead得分表等方法.特别地,针对静态的look-ahead得分表的方法,提出了基于文法词历史中词的联合概率进行筛选的策略.实验证明上述方法能够在一定程度上提高解码速度,综合使用上述方法,能够使得系统由2.0倍实时提高到约1.3倍实时.