首页> 外文期刊>電子情報通信学会技術研究報告 >[招待講演]何かが欠けている音声認識研究
【24h】

[招待講演]何かが欠けている音声認識研究

机译:[特邀演讲]语音识别研究缺乏

获取原文
获取原文并翻译 | 示例
       

摘要

これまで約40年間にわたって、音声認識に関する研究を行ってきた。この間に統計的手法をべースに、音声認識技術は大きく進歩したが、まだ人の能力には遠く及ばない。最近は、学会や学会誌で発表される技術の進歩がやや飽和しており、人の能力に近付く道筋が見えない。現在の研究のアプローチには、何かが欠けているように思われる。それが何かは明確でないが、現在の単純な枠組みではなく、多数のレベルの多様な知識を最適に組み合わせて着実な認識へ導く、統計的な知識処理のフレームワークを構築する必要があるように思われる。%I have been working on automatic speech recognition (ASR) research for almost 40 years. Although ASR technology has made significant progress based on statistical techniques during this period, its performance is still far below that of human beings. Technological progress reported at conferences and in journals has recently begun to saturate, and it is unclear how we can best continue to approach human levels of accuracy. It seems that something is missing in the approach of current research. Although it is unclear exactly what is missing, it seems we need to construct a framework for statistical knowledge processing which can achieve reliable recognition by optimally combining various knowledge resources modeled at many levels.
机译:我已经学习语音识别约40年了。在此期间,基于统计方法的语音识别技术取得了长足的进步,但仍远低于人类的能力。最近,在学术团体和学术期刊上发布的技术进步已经有些饱和,我们看不到提高人类能力的途径。当前的研究方法似乎缺少某些东西。目前尚不清楚这是什么,但是似乎有必要建立一个统计知识处理的框架,而不是当前的简单框架,该框架可以最佳地组合各种层次的各种知识并导致稳定的识别。好像。我从事自动语音识别(ASR)研究已有40年之久了,尽管在此期间ASR技术在基于统计技术的基础上取得了长足的进步,但其性能仍然远远低于人类。最近的期刊开始饱和,目前尚不清楚我们如何才能最好地继续达到人类的准确性水平。目前的研究方法似乎缺少了一些东西,尽管目前尚不清楚确切缺少了什么,但似乎我们需要构建统计知识处理的框架,该框架可以通过最佳地组合在多个级别建模的各种知识资源来获得可靠的识别。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号