首页> 中文学位 >基于OCR识别的表格分析编改系统研究
【6h】

基于OCR识别的表格分析编改系统研究

代理获取

摘要

表格是一种常用的数据资料载体,广泛应用于各种场合。印刷表格中的信息经常需要批量输入到计算机中进行整理和分析,通常的做法是由人工录入,但这种方法的缺点是效率低,易出错,成本高。本文通过对一种基于OCR识别的自动化表格数据生产加工系统进行研究,旨在提高加工效率和数据质量并节约加工成本。
   在本文所研究的数据加工系统中,通过细化加工需求,将表格录入分解为表格结构的版面分析和单元格文字的编改校对两个相对独立的问题。本文所研究的加工系统采用自动化的方法分析表格结构并由人工辅助加以调整,再选取两种有互补性的识别引擎对表格的版面进行识别得到所有单元格的文字信息,然后对比并标记出不相同的文字进行人工编改和校对,最后将表格的版面信息和校对正确的文字整合自动输出电子表格文件。
   本文设计了结构化的数据加工流水线,支持数百人同时在线完成海量数据加工任务;大量运用了自动化机器人技术,使用双引擎识别文字对比的方法,减轻了人工操作的负担;采用人工双路编改校对的模式,有效的控制了加工的错误率。经过实践,这种设计显著提高了数据加工的效率和质量,降低了加工成本,并提供了一套高效的,可靠的,运行稳定的,使用简便的表格数据加工解决方案。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号