首页> 中文期刊> 《计算机应用与软件》 >Postscript格式科技文献中数学表达式的提取方法

Postscript格式科技文献中数学表达式的提取方法

     

摘要

从Postscript格式的科技文献中提取识别数学表达式,是数学表达式识别领域的一个新的研究方向.主要针对以Word和Latex为生成源的PS文档,提出了基于内容的数学表达式提取方法.首先重载了PS语言中的一些相关命令,以提取PS文档中的字符与线段信息;之后根据字符名称、字体、位置等信息对字符进行分析,同时连接线段并加以识别,从而提取出数学符号;最后,根据符号间的空间位置关系和启发式规则,将数学符号归并,提取出最终的表达式.实验结果表明该方法正确率达到98.56%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号