摘要:语音理解是通过一系列的抽象处理层次,将语音携带的信息变换到某个已知结构上.其主要困难是语音的多变性.与其他语种相比,处理汉语语音的特殊困难是:(1)大量的包括双元音和三元音语在内的元音使元音识别中空间的划分更困难(汉语约37个子空间,英语为21,法语为16);(2)音调变化.本文所介绍的系统的基本假设是:不同抽象层次的限制在语音的产生、传播和感知过程中决定了语音的变化,因而有关这些限制的知识可以被表示和开发,以对语音的结构作出假设并去除不确定性.系统的工作过程涉及到信号至基本符号的转换,符号推理和自然语言到基本函数的变换.系统的功能是可以理解汉语自然语言的一个子集,以 LISP 可执行函数的形式给出,使用音素作为基本识别单元但无需对音素实行预分割。