面向移动平台的复杂文档结构分析系统

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

复杂文档结构分析一直以来是光学字符识别系统中很重要的一个环节，用于将排版复杂的文档进行处理，解析出文档上所有元素的位置及阅读顺序，该技术广泛应用于票据识别、名片识别、纸质文稿电子化等系统中，其中比较有名的有Google News Archive，该项目将近几十年的报纸扫描处理，并构建索引，使得用户搜索相关新闻时可以直接看到事件当天的报纸。
　　通常复杂文档结构分析都会借助图像处理技术进行预处理，然后借助形态学、几何学等分析其物理结构，对于逻辑结构的获取则通过机器学习或模式识别相关方法。本文提出一种基于图像处理和元素位置信息的文档结构分析方法，结合经验规则，可以高效的对文档进行处理。在经过图像处理技术进行预处理后，得到文档上所有的文字行，然后将这些文字行视为障碍物，通过基于位置信息的分栏查找算法，逐步寻找页面上的空白块，同时加入长宽比等因素，最终得到文档页面上分栏的位置，按照分栏将文字行排序，然后将排序结果，即文档结构输出。
　　以往复杂文档结构分析算法的评测都是比较繁琐的，其关键原因是文档结构的标注比较麻烦。本文提出了一种高效的文档结构标注方法，将以往在PC平台进行的标注工作转移到了iPad，移动平台优良的操作体验使得标注工作得以简化。与以往的用鼠标框选的操作不同，在iPad上可以直接用手指进行拖拽框选。对于文字行级别的标注，本系统借助图像处理技术进行文字行提取，然后给标注者行标注提示，若处理结果正确则不需要再逐行标注。在大多数情况下，本系统给出的标注提示都是正确的。对于算法的评测，本文选取编辑距离、准确率和召回率三个标准，能较好地反映算法性能。
　　经过一系列实验验证，本文提出的基于位置信息的复杂文档结构分析算法对于学术论文类文档的结构分析效果很好，在人工标注的30篇共202页文档的评测集上实验，准确率达到91.1％，召回率达到85.1%，同以往方法相比有一定提升。

著录项

作者
武云鹏;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机技术
授予学位硕士
导师姓名陈清财;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.43;
关键词
图像处理; 文档结构; 标注方法; 光学字符; 识别系统;

相似文献

中文文献
外文文献
专利

1. 面向移动平台的深度学习复杂场景目标识别应用 [J] . 许博鸣 ,刘晓峰 ,业巧林 . 陕西师范大学学报（自然科学版） . 2019,第005期
2. 智能会议室预订系统设计中面向移动平台技术的应用 [J] . . 信息技术与信息化 . 2019,第006期
3. 面向移动平台的会议室预订系统设计与研究 [J] . 张瑛 . 辽宁工业大学学报（自然科学版） . 2018,第003期
4. 面向个人移动平台的室内三维导航系统设计与实现 [J] . 王行风 . 计算机与现代化 . 2015,第002期
5. 面向移动平台的新闻资讯系统的设计与实现 [J] . 张旭红 ,刘渭滨 . 计算机应用与软件 . 2014,第001期
6. 一种基于文档的移动平台间UI控件对应方法 [C] . Tongtong XU ,徐同同 ,Xiaomei ZHENG . 第15届全国软件与应用学术会议（NASAC2016） . 2016
7. 面向移动平台的离线手写文档识别系统 [A] . 张纪绪 . 2017

面向移动平台的复杂文档结构分析系统

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅