首页> 外文OA文献 >Real-time speech recognition system for robotic control applications using an ear-microphone
【2h】

Real-time speech recognition system for robotic control applications using an ear-microphone

机译:使用耳麦克风的机器人控制应用实时语音识别系统

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This study is part of an ongoing research started in 2004 at the Naval Postgraduate School (NPS) investigating the development of a human-machine interface commandand- control package for controlling robotic units in operational environments. An ear microphone is used to collect the voice-activated commands providing hands-free control instructions in noisy environments [Kurcan, 2006; Bulbuller, 2006]. This study presents the hardware implementation of a theoretical Isolated Word Recognition (IWR) system designed in an earlier study. The recognizer uses a short-term energy and zero-crossing based detection scheme, and a discrete Hidden Markov model recognizer designed to recognize seven isolated words. Mel frequency cepstrum coefficients (MFCC) are used for discriminating features in the recognizer phase. The hardware system implemented uses commercial off-the-shelf (COTS) electronic components, in-ear microphone, is portable and costs under $50.00. The implemented speech capturing system uses the ear-microphone and the Si3000 Audio Codec to capture and sample speech clearly. The microprocessor processes the detected speech in real-time. The microprocessor's I/O devices work effectively with the audio codec and computer for sampling and training, without communication problems or data loss. The current implementation uses 1.181 msec to process each 15 msec data frame. Resulting recognition performances average around 73.72%.
机译:这项研究是海军研究生院(NPS)于2004年开始进行的一项正在进行的研究的一部分,该研究旨在研究人机界面命令和控制包,以控制操作环境中的机器人单元。耳麦克风用于收集语音激活的命令,从而在嘈杂的环境中提供免提控制指令[Kurcan,2006; Bulbuller,2006年]。本研究介绍了在较早的研究中设计的理论隔离单词识别(IWR)系统的硬件实现。识别器使用基于短期能量和零交叉的检测方案,以及设计用于识别七个孤立单词的离散隐马尔可夫模型识别器。梅尔频率倒谱系数(MFCC)用于识别识别器相位中的特征。实施的硬件系统使用商用现货(COTS)电子组件,入耳式麦克风,便携式且成本低于50.00美元。实施的语音捕获系统使用耳麦克风和Si3000音频编解码器来清晰地捕获和采样语音。微处理器实时处理检测到的语音。微处理器的I / O设备可与音频编解码器和计算机有效地进行采样和培训,而不会出现通信问题或数据丢失。当前实现使用1.181毫秒来处理每个15毫秒的数据帧。产生的识别性能平均约为73.72%。

著录项

  • 作者

    Koliousis Dimitrios S.;

  • 作者单位
  • 年度 2007
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号