首页> 中文期刊>计算机应用与软件 >一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法

一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法

     

摘要

维吾尔文和阿拉伯文是采用阿拉伯文字母的从右向左书写的连写文字.它们识别方法的研究对于多文种文本图像内容的利用具有重要意义.利用HTK工具包,分别建立基于隐马尔科夫模型HMM(Hidden Markov Model)的印刷体维吾尔文和阿拉伯文识别系统,其中特征提取部分采用分布密度特征和局部方向特征.研究利用HTK工具建立维吾尔文和阿拉伯文统计语言模型,并将语言模型用于改进识别系统性能.实验结果表明采用统计语言模型可有效提高文字识别系统性能.其中,在包含24 000个单词的印刷体维吾尔文测试集上,通过利用语言模型识别率从78.28%提高到97.45%;在包含759个单词的印刷体阿拉伯文测试集上,通过利用语言模型识别率从79.07%提高到85.80%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号