【24h】

Page grammars and page parsing. A syntactic approach to documentlayout recognition

机译:页面语法和页面解析。文档布局识别的语法方法

获取原文

摘要

Describes a syntactic approach to deducing the logical structureof printed documents from their physical layout. Page layout isdescribed by a two-dimensional grammar, similar to a context-free stringgrammar, and a chart parser is used to parse segmented page imagesaccording to the grammar. This process is part of a system which readsscanned document images and produces computer-readable text in a logicalmark-up format such as SGML. The system is briefly outlined, the grammarformalism and the parsing algorithm are described in detail, and someexperimental results are reported
机译:描述一种推论逻辑结构的句法方法 从其物理布局打印的文档。页面布局为 用二维语法描述,类似于上下文无关的字符串 语法,并使用图表解析器来解析分段的页面图像 根据语法。此过程是读取以下内容的系统的一部分 扫描文档图像并以逻辑方式生成计算机可读文本 标记格式,例如SGML。系统简要概述,语法 详细描述了形式主义和解析算法,其中一些 实验结果报道

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号