首页> 中国专利> 一种基于汉字图像轮廓特征描述的碑文修复方法

一种基于汉字图像轮廓特征描述的碑文修复方法

摘要

一种基于汉字图像轮廓特征描述的碑文修复方法,该方法属于计算机虚拟现实技术、机器视觉、图像处理领域,碑文修复所用的信息限定在同源碑文或者同一作者的书法作品中。在预处理过程中将碑文进行单字分割,并对提取的单字进行部件笔画分解。将这些获取的汉字部件和笔画组成一个部件笔画模板集合。在修复损坏汉字的过程中,首先提取损坏汉字的可信部分部件或笔画的结构信息和轮廓信息,利用结构匹配和轮廓段的部分对应,从构建的模板集合中搜索出相似度最高的模板作为损坏部分修复的信息源进行修复。本发明相比其它图像修复的方法,能够在较好的保持碑文原有风格的基础上恢复汉字缺损部分的结构信息和轮廓细节信息。

著录项

  • 公开/公告号CN105069766A

    专利类型发明专利

  • 公开/公告日2015-11-18

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN201510441241.4

  • 申请日2015-07-24

  • 分类号G06T5/40;

  • 代理机构北京科迪生专利代理有限责任公司;

  • 代理人杨学明

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-12-18 12:16:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-08

    授权

    授权

  • 2015-12-16

    实质审查的生效 IPC(主分类):G06T5/40 申请日:20150724

    实质审查的生效

  • 2015-11-18

    公开

    公开

说明书

技术领域

本发明属于虚拟现实技术、计算机视觉与计算机图形学领域,具体地说是针对碑文的图 像修复的汉字部件笔画分解方法。

背景技术

碑文数字化修复是图像修复的一个分支。目前在图像修复方面,前人做了大量的工作。 在图像修复领域的发展,根据图像修补的含义和修补的方式主要有两个方向。一是从图像修 补的含义本身出发,即对图像上细小噪声、不规则划痕的修复,这种情况一般采用的是基于 偏微分方程或变分方法来解决。基于变分问题的修复方法具有较充分的理论基础,但是该方 法的缺点是修复图像不自然,修复区域轮廓明显。用基于偏微分方程的方法来修复图片上大 面积的缺损区域时会产生模糊现象,所以该方法不适用于修补大面积的纹理区域。二是针对 于图片上大区域的缺失损坏,这类方法采用的是基于样本纹理的图像修补方法和纹理生成技 术,与方向一相比有效的避免了模糊现象的发生。利用图像的纹理信息来引导纹理合成的过 程,有效地提高了图像的修复质量,保持了图像结构纹理。而这种方法的主要问题主要是在 损坏区域的结构信息恢复上。为了解决这个问题前人提出了不少改进的图像修复方法,如基 于样例的图像修复方法,它利用受损区域周围信息的isophote方向和发线方向为待修复区域 块设置优先值,优先级大的部分将优先被修复,优先级小的像素将押后修复,这些优先级记 录在一张表中。在修复中通过不断的更新表中的各像素优先级来引导修复的优先次序,以达 到保持图像在该部分结构连续的目的。这种方法的缺点是只能保持线性(如直线)结构,对 于曲线结构效果难以人满意。基于结构传播(structurepropagation)的图像修复方法是另一 种注重结构修复的图像修复方法。在这种方法中,首先由用户通过添加辅助线的方式指定图 像中损坏区域周围结构在损坏区域延伸的方式,即根据人的经验喜好等画出损坏区域的结构 线。在辅助线指导下通过结构传播对损坏区域内进行修复。建立图像集是另一个可以对结构 进行修复的图像修复方法,通过在数以百万的图像中匹配到和损坏图像可能相似的图像,然 后利用该图像对应部分来填补图像损坏区域。这种方法能够有效恢复原图像丢失部分,但是 修复结构依赖于图像库。

针对于汉字图像(如书法,碑文等)来说,其修复特点是,注重结构信息和轮廓细节的 修复,而不强调纹理信息的修复。修复汉字的图像的重点在于恢复损坏部分结构信息,汉字 是经过二值化后的图像基于结构传播的方法不适合于二值图像,而基于汉字集方法的难点在 于书法作品有限和流传下来的碑文只有少量的可用样本,样本数量有限,在修复时不一定能 找到合适的汉字作为模板。

发明内容

本发明目的为了克服上述缺点,解决现有图像处理技术不能有效恢复碑文图像损坏部分 结构信息的缺点,提供一种基于汉字图像轮廓特征描述的碑文修复方法,解决了针对碑文图 像难以恢复缺损区域结构和轮廓细节信息的缺点,较好解决了碑文图像不程序度缺损的问 题。

为了实现上述目的,本发明所采用的技术方案是:一种基于汉字图像轮廓特征描述的碑 文修复方法,其特征在于如下步骤:

步骤1、根据排列特点使用灰度直方图的方法进行碑文单列分割,对分割出的单列再用 灰度直方图统计出灰度分布规律分割出单个汉字。

步骤2、对步骤一中获得的单个汉字进行部件笔画分解,构建模板集合。

步骤3、对模板中的所有模板使用SC描述子进行描述,用于相似部件笔画的匹配检索。

步骤4、修复碑文中损坏汉字时,针对汉字缺损的严重程度的不同分为基于部件的修复 和基于单个笔画的修复。对于一个汉字中某个部件的大部分区域缺损的情况。首先获得损坏 汉字部件的拓扑信息,通过拓扑即部件骨架采样点进行SC描述子描述。在步骤2中提取到 的部件集合基于SC算法的拓扑相似度度量,检索出相似度最高,即最有可能与缺损部件相 近的部件作为缺损区域修复的信息来源。对于只有某个笔画的局部受损的情况,先对受损笔 画的可信区域轮廓使用形状描述矩阵对其进行描述,对获取的笔画集合中的各笔画也进行同 样的表示。经过IS-Matching轮廓段匹配算法在笔画集合中检索出与缺损笔画相似度最高的 笔画作为笔画修复的信息来源。利用上述方法找到作为修复信息来源的模板指导下完成汉字 中损坏部分的修复。

相对于现有的其它技术相比本发明的优点在于:本发明针对的是碑文图像修复技术,修 复过程中了对汉字构型分析,通过部件,笔画多层次进行碑文汉字的修复。首先构建模板集 合,根据汉字缺损的不同程度进行分层次修复,同时涉及了汉字的结构信息和轮廓细节信息。

附图说明

图1是本发明基于汉字图像轮廓特征描述的碑文修复方法的过程示意图;

图2是本发明的汉字单字提取中的碑文列分割示意图;

图3是本发明的汉字单字提取中的碑文列分割出单字的示意图;

图4是本明的汉字修复中部件缺损修复流程图;

图5是本发明的汉字修复中笔画层次修复流程图;

图6是本发明的汉字修复结果展示。

具体实施方式

如图1所示,本发明基于汉字图像轮廓特征描述的碑文修复方法采用如下步骤:

步骤一、碑文分割:

(1)首先对碑文图像平滑后再进行二值化处理,在保留碑文中汉字边缘信息的基础去 除噪声。

(2)根据碑文书写过程是从上至下进行书写的,所以在竖直方向上是保持对齐的,对 预处理后的碑文在竖直方向上进行投影形成的直方图的波峰波谷比较明显,可以找到准确的 列分割位置,分割出单列。

(3)在分割出单列的基础上,对单列进行水平方向上投影,结构汉字的高宽的比例约 束,对分割过窄和过宽的情况进行调整,正确分割出单个汉字。

步骤二、部件和笔画分解:

(1)笔画的分解。使用索引表细化算法对步骤一分割出的汉字进行细化得到骨架,在 大小为256的索引表的的指导下完成汉字图像的细化过程。细化得到的是单个像素宽度的骨 架。在细化过程中必须满足三个约束:1.内部点不能删除。2.直线端点不能删除。3.如果点P 是边界点,去掉P后,如果连通分量不增加,则P可以删除。经过细化得到汉字骨架,这些 骨架点的交叉点为分界点可以得到许多的笔画骨架段,对这些骨架段使用合并算法进行合并 可以得到完整笔画骨架。笔画的完整笔画骨架生成满足以下三个规则:1.两个笔画骨架段相 连接,2.两个笔画骨架段与目标笔画骨架段的角度差值小于给定阀值。3.合并后得到的笔画 骨架与目标笔画骨架的角度差小于给定阀值。获得完整的笔画骨架后,根据骨架与轮廓的对 应关系得到完整的笔画。

(2)构件的分解。通过边缘跟踪将目标轮廓采样点进行重新组织,得到链状的目标轮 廓用于部件分解。1.确定起始点。2.逆时针检测当前点的八领域中的下一个像素点并更新当 前点。3.重复上述两步直到跟踪结束。利用得到的具有链状形式的边缘点集,经过最优组合 原理得到输入汉字的骨架与目标部件的对应关系后,寻找轮廓点与骨架的对应关系,将对应 于部件骨架的轮廓点提取出来并在断开的位置连接,得到分割好的部件。

步骤三、基于拓扑结构匹配的部件选择和部分匹配的轮廓段配准:

(1)拓扑描述与部件选择。对于部件缺损的情况,需要找到相近的部件,部件由多个 笔画组成,有各自的拓扑结构。对模板集合中的部件经过索引表细化算法,得到单像素宽度 的部件骨架,使用SC描述子对骨架采样点集进行描述,由公式以下统计出骨架点间的形状 直方图。

其中,表示当前骨架点为中心时第k个区域的骨架点数;#操作表示q为落入第k个区 域中的不同于pi点的轮廓上的其余点的数量,k表示极坐标系对二维平面进行划分的区域编 号,pi为待描述的骨架点,q表示不同于pi的骨架点,bin(k)表示极坐标系中被划分的第k个区 域;

同样的,对缺损的汉字部件进行拓扑描述。经过公式(6)(7)计算机各模板之间的相 似度d。

其中,pi是形状采样点集A上的点,qj是形状形状采样点集B上的点,A和B为两个待比较的 点集,N为极坐标空间划分的区域数。

公式(7)利用公式(6)的结果给出了两个点集的相似度,从模板集合中检索出与缺损 部件相似度最高的部件作为部件修复的信息源。

其中,pi是形状采样点集A在区域h上的点,qj是形状采样点集B在区域h上的点;Ah和Bh为两个待比较的点集在极坐标空间中区域h上的子集;N为极坐标空间划分的区域数;

(2)轮廓描述。针对单字笔画损坏的情况,由于单笔画的拓扑结构的区分度不大,需 要通过损坏笔画中可信区域的轮廓进行描述应用于模板笔画的选择。首先需要使用形状描述 矩阵对损坏笔画可信区域轮廓进行表示,得到的是一个如公式(8)的N*N矩阵,N为轮廓 段采样点数。

其中角αij是点pi与点pj间的连线和点pi与参考点pj位置的第三个点pj-△间连线的夹 角。

(3)轮廓段配准。在提取了缺损笔画可信部分轮廓段集合Ε={e1,e2,…ek},k表示轮廓 段数。对各段轮廓均匀采样得到k个点集Pi={p1,p2,…,pn},n表示各段的采样点数,各轮 廓段n可以不同。对模板集合中每个笔画的轮廓进行类似的表示Pm={p1,p2…,pN},其中m 表示笔画集合中各笔画的编号。根据前面描述方法,对缺损笔画可信轮廓段和模板集合中各 笔画建立形状描述矩阵。为了找到可信轮廓段与笔画集合中各笔画轮廓间的最佳轮廓匹配段 的过程,即寻找对应轮廓段的过程就是计算矩阵中相似块的过程。公式(9)给出了具体求 解方法。

其中r表示相似轮廓段点数,A和B表示两个相似度度量的形状。s和m分别表示形状 A和B的采样点数。

步骤四、汉字分层次修复:

(1)根据汉字损坏的程度不同,进行不同层次的修复。对部件缺损的情况进行部件层 次的修复,首先根据前面描述的部件选择算法,选择最佳部件修复模板,图4给汉字部件损 坏部分恢复的流程图。

(2)对于部件笔画受损的情况,进行笔画层次的修复。采用上述轮廓描述算法先对受 损笔画的可信区域轮廓使用形状描述矩阵对其进行描述,对获取的笔画集合中的各笔画也进 行同样的表示,经过IS-Matching轮廓段匹配算法在笔画集合中检索出与缺损笔画相似度最 高的笔画作为笔画修复的信息来源对缺损笔画进行修复。图5给出了汉字笔画层次修复的流 程图。

从修复结果图6中可看出本发明在以同源部件笔画为模板指导损坏汉字的修复,能够很 好的恢复汉字的受损部分,同时保留了原有汉字的书写风格。

本发明未详细阐述部分属于本领域公知技术;以上所述,仅为本发明部分具体实施方式, 但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可 轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号