版面分析
版面分析的相关文献在1989年到2023年内共计176篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术
等领域,其中期刊论文75篇、会议论文19篇、专利文献177367篇;相关期刊52种,包括计算机仿真、计算机工程、计算机工程与设计等;
相关会议14种,包括中国科技新闻学会第十一次学术年会、第四届图像图形技术与应用学术会议、全国图书馆古籍工作会议等;版面分析的相关文献由385位作者贡献,包括李涛、冯歆鹏、周骥等。
版面分析—发文量
专利文献>
论文:177367篇
占比:99.95%
总计:177461篇
版面分析
-研究学者
- 李涛
- 冯歆鹏
- 周骥
- 汪同庆
- 田学东
- 蔡海蛟
- 兴百桥
- 刘成林
- 张晓强
- 王晓松
- 章成全
- 丁二锐
- 任莉
- 刘经拓
- 叶俊勇
- 吴甜
- 吴飞
- 姚锟
- 李煜林
- 杨波
- 王海峰
- 田瑶琳
- 罗予频
- 赵富佳
- 郭宝兰
- 陈明
- 韩钧宇
- 丁晓青
- 业宁
- 何盼
- 冯万利
- 刘佳卉
- 刘宏
- 刘建胜
- 刘星辰
- 刘正珍
- 刘海萍
- 刘飞
- 史广顺
- 叶家鸣
- 吕亚军
- 吴天瑞
- 吴波
- 周泓
- 周炬
- 周迅溢
- 周鸿
- 唐佳珊
- 唐文
- 姚恒志
-
-
贡去卓么;
才让加;
三知加
-
-
摘要:
藏文古籍文档是中华民族宝贵的文化遗产,采用数字化处理技术对藏文古籍文档进行保护和传承具有重要的历史意义。针对藏文古籍文档文本区域检测提出了一种基于图像语义分割的方法。利用判别式对抗网络框架下的语义分割网络对藏文古籍文档不同类型的文本区域进行了像素分类;其次,根据像素分类结果提取了各个文本区域的轮廓;最后,将检测到的版面布局信息进行保存。最终实现藏文古籍文档的文本区域检测。通过拉萨版《甘珠尔》(藏文)的扫描页面构建了自定义的藏文古籍文档图像数据集,并在上述数据集上进行了实验。经实验表明,在上述数据集上得到了较好的检测效果,证明了上述方法的有效性。
-
-
王秀友;
任方针;
刘华明;
时如梦;
王胜波
-
-
摘要:
古籍文档图像版面分割是古籍数字化流程中至关重要的一步,藏文古籍文档版面分割是后续藏文版面分析等工作的基础.针对藏文古籍文档版面分割问题,提出了基于分段投影法的藏文古籍文档图像版面分割方法,该方法采用分段投影法,利用古籍版面结构与各分段投影值之间的联系,通过两次分段多次投影得出古籍文档图像版面分割结果.实验结果表明,该方法取得了较好的古籍文档版面分割结果,为藏文古籍图像的版面分割提供了一种可以借鉴的思路.
-
-
-
田瑶琳;
陈善雄;
赵富佳;
林小渝;
熊海灵
-
-
摘要:
近年来,基于深度学习的版面分析和风格迁移等技术得到广泛的应用并取得了许多突破.为了对古籍多风格纹理进行复原,提出一种古籍版面分析和风格融合网络结构.首先利用生成对抗网络和多风格背景生成模型进行模型训练,形成多风格的古籍纹理;然后提出重排列算法进行版面分析,调整前景文字的排列位置;最后通过前景文字和古籍风格背景的融合实现文本背景的多风格生成.实验中,以古彝文、古汉语(秦小篆)、女真文的古籍和古画作为数据样本,对DCGANs模型进行参数和结构上的改进以提高模型的生成性能,结合交叉熵损失函数和Fréchet inception distance(FID)对生成结果进行评估,得到在FID上表现最佳的训练模型M8并将其作为多风格背景生成模型,与DCGANs模型相比,生成性能提高19.26%,图像生成质量有了明显提升.
-
-
贾运;
田学东;
左丽娜
-
-
摘要:
古籍版面图像结构复杂,对其进行有效、准确的分析是实现古籍汉字识别与检索的前提和基础.对古籍汉字版面分析的关键问题展开研究,在对古籍版面特点进行分析与归纳的基础上,提出基于局部离群因子(local outlier factor,LOF)和波动阈值的古籍版面分析方法.首先,采用基于LOF的分类算法对古籍版面图像投影分割后的区域进行分类,确定存在分割问题的候选混合区域;然后,利用波动阈值对候选混合区域中的文字与框线粘连部分进行分割;最后,确定古籍版面中的文字区域并输出.实验结果表明,该算法能够有效地分离古籍文字区域和框线区域,版面分类和分割准确率分别为87.02%、78.69%.
-
-
王珂;
杨芳;
姜杉
-
-
摘要:
光学字符识别是计算机视觉领域的重要研究内容之一,在实际生产环境中具有巨大价值。传统光学字符识别包括文本图片的预处理阶段、字符区域的定位与识别以及对识别结果的后优化三个部分。随着深度学习的不断发展,传统框架被打破,基于深度学习的文本目标识别算法能更好地识别复杂背景下的图片。将对光学字符识别的发展历程和现阶段最新的研究结果进行介绍。
-
-
陈璇;
贺建军;
李厚杰;
武林秀
-
-
摘要:
提出一种基于Mask R-CNN深度学习框架的满文文档版面分析方法,将满文文档版面分析问题转化为基于深度学习的图像实例分割问题.使用ResNet101网络和FPN网络构成的卷积神经网络自动提取满文文档图像特征,特征图经过RPN网络和RoI Align层生成新的特征图.新特征图经过全连接层完成感兴趣区域的类别和边框预测,并经过全卷积神经网络对感兴趣区域的像素进行分类得到mask预测,最终实现满文文档图像的实例分割.通过《新满汉大辞典》的文档图像构建了满文文档图像数据集,算法在该满文文档图像数据集上进行了实验.实验结果表明,本算法在满文文档版面分析中取得了较好的检测和分割效果.
-
-
刘成林
-
-
摘要:
[目的]文档图像是一类广泛存在且具有重要应用价值的数据.从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标.自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展.本文为科研人员和工程人员提供一个比较全面的文档图像识别技术总体介绍,便于大家开展技术创新和技术应用.[方法]本文在介绍文档识别应用背景的基础上,对该领域历史上主要方法进行回顾,对当前技术状况和研究动态进行分析,并展望未来发展趋势.[结果]1950年代到2000年代,在统计模式识别、特征提取、结构分析、字符切分、字符串识别和版面分析等方面积累了大量有效方法.[结论]近年来深度学习(深度神经网络)逐渐成为主导性的方法,使文字检测和识别的性能得到明显提升,但在复杂版面分析能力、文字识别的可靠性、泛化性等方面仍然存在不足.
-
-
陈璇1;
贺建军1;
李厚杰1;
武林秀1
-
-
摘要:
提出一种基于Mask R-CNN深度学习框架的满文文档版面分析方法,将满文文档版面分析问题转化为基于深度学习的图像实例分割问题。使用ResNet101网络和FPN网络构成的卷积神经网络自动提取满文文档图像特征,特征图经过RPN网络和RoI Align层生成新的特征图。新特征图经过全连接层完成感兴趣区域的类别和边框预测,并经过全卷积神经网络对感兴趣区域的像素进行分类得到mask预测,最终实现满文文档图像的实例分割。通过《新满汉大辞典》的文档图像构建了满文文档图像数据集,算法在该满文文档图像数据集上进行了实验。实验结果表明,本算法在满文文档版面分析中取得了较好的检测和分割效果。
-
-
-
-
张硕;
王幸元
- 《吉林省第九届科学技术学术年会》
| 2016年
-
摘要:
PDF格式文件目前己成为数字化信息事实上的一个工业标准,它的跨媒体、跨平台、安全性使其在文档电子化中应用越来越广泛,对其研究显得日益重要.针对使用双层PDF文档电子化技术实现的文档管理手段,不仅可以有效保存纸质文档的原始面貌,还可以借助第二层文档的结构化数据进行查找、批注、修改和加密等操作,是目前企业解决文档电子化的有效方法.如何生成双层PDF文件在国内研究的较少,本文探讨了双层PDF文件的生成方法,详细介绍了双层PDF文件格式、特点及应用,包括图像预处理、特征提取、字符分割、图像分类、版面分析等。
-
-
王科俊;
陈卉
- 《第四届图像图形技术与应用学术会议》
| 2009年
-
摘要:
本文主要介绍包含公式识别功能的印刷体中文文档识别系统.该系统能够进行含有汉字、公式、表格和图形的中文文档识别,能够将无法修改内容的文档图像转化成可编辑的电子文档.本文分析了文档图像预处理、版面分析以及汉字识别和公式识别模块的实现方法,重点讨论了对公式的识别及输出,通过实例说明了本系统的识别能力.
-
-
黄磊;
刘昌平
- 《第八届全国汉字识别学术会议》
| 2003年
-
摘要:
信函自动分拣系统是OCR领域的一个具体应用,是一个有广泛应用前景但又极具难度的课题.本文详细的介绍了信函分拣系统软件部分以及在实现过程中所采用的具体方法,包括图像预处理,邮编定位与识别,版面分析和版面理解,单字分割,及后处理等各个过程.针对信函分拣这一特殊应用,我们在现有技术的基础上,提出了一些行之有效的算法,如图像去噪,地址定位,基于识别的动态规划分割方法等.系统采用了邮政编码与地址相互校正的分拣方法,克服了邮编分拣的一些局限.系统在合肥等地进行了试点,取得了较好的效果.
-
-
李燕
- 《中国中文信息学会中文信息处理技术研讨会》
| 2002年
-
摘要:
本文对打印表格的共性及自动识别中版面分析和字符识别进行了探讨,提出通过对表格的整体定位,提取出要识别的数字图象,用笔划密度特征、轮廓特性及局部拓扑特征等方法进行识别,并以两种具有代表性的表格为对象进行测试,取得了较好的试验结果.
-
-
陶贤都;
崔敏钿
- 《中国科技新闻学会第十一次学术年会》
| 2012年
-
摘要:
当下科技和生活的联系越来越紧密,受众面广、可读性强的都市类媒体无疑是传播最新科技动态、宣传科学技术的重要平台.《南方都市报》作为都市报的代表,其科技新闻具有鲜明的特点.《南方都市报》科技新闻以市民视角为关注点,科技新闻语言通俗有趣,科技新闻叙事角度独特.《南方都市报》发挥了兼顾传播国内、国际,特别是本地区域性科技新闻的功能.《南方都市报》的科技新闻为其他都市类报纸强化科技新闻提供了借鉴的经验.
-
-
陶贤都;
崔敏钿
- 《中国科技新闻学会第十一次学术年会》
| 2012年
-
摘要:
当下科技和生活的联系越来越紧密,受众面广、可读性强的都市类媒体无疑是传播最新科技动态、宣传科学技术的重要平台.《南方都市报》作为都市报的代表,其科技新闻具有鲜明的特点.《南方都市报》科技新闻以市民视角为关注点,科技新闻语言通俗有趣,科技新闻叙事角度独特.《南方都市报》发挥了兼顾传播国内、国际,特别是本地区域性科技新闻的功能.《南方都市报》的科技新闻为其他都市类报纸强化科技新闻提供了借鉴的经验.
-
-
陶贤都;
崔敏钿
- 《中国科技新闻学会第十一次学术年会》
| 2012年
-
摘要:
当下科技和生活的联系越来越紧密,受众面广、可读性强的都市类媒体无疑是传播最新科技动态、宣传科学技术的重要平台.《南方都市报》作为都市报的代表,其科技新闻具有鲜明的特点.《南方都市报》科技新闻以市民视角为关注点,科技新闻语言通俗有趣,科技新闻叙事角度独特.《南方都市报》发挥了兼顾传播国内、国际,特别是本地区域性科技新闻的功能.《南方都市报》的科技新闻为其他都市类报纸强化科技新闻提供了借鉴的经验.
-
-
陶贤都;
崔敏钿
- 《中国科技新闻学会第十一次学术年会》
| 2012年
-
摘要:
当下科技和生活的联系越来越紧密,受众面广、可读性强的都市类媒体无疑是传播最新科技动态、宣传科学技术的重要平台.《南方都市报》作为都市报的代表,其科技新闻具有鲜明的特点.《南方都市报》科技新闻以市民视角为关注点,科技新闻语言通俗有趣,科技新闻叙事角度独特.《南方都市报》发挥了兼顾传播国内、国际,特别是本地区域性科技新闻的功能.《南方都市报》的科技新闻为其他都市类报纸强化科技新闻提供了借鉴的经验.
-
-
王冰卿
- 《中国科技新闻学会第十一次学术年会》
| 2012年
-
摘要:
在媒体日益激烈竞争的今天,特刊已经成为报纸在重要活动、重大新闻事件、重大节日中的重要报道形式.本文以《中国科学报》元旦特刊为例,对报纸各个部分进行解析,从选题策划,报道内容,板式设计,广告宣传等方面分析其特色,并对其产生的影响进行分析.