首页> 中国专利> 一种对书法作品中文字神采信息的提取方法

一种对书法作品中文字神采信息的提取方法

摘要

本发明公开了一种对书法作品中文字神采信息的提取方法,属于图像处理领域。本发明通过将待处理书法作品中的色彩空间进行转换,之后根据第一通道阈值对转换后的待处理书法作品的类型进行区分,根据区分后的是碑图像还是帖图像分别进行处理,以便得到碑图像中文字形质信息的图像和帖图像中文字形质、神采信息以及印章形质、神采信息的图像。避免了现有技术中仅依靠边缘检测导致的文字信息不够完整的缺陷,增加了检测到的文字信息的细节表现,提高了对书法作品研究的便利性。

著录项

  • 公开/公告号CN104834890A

    专利类型发明专利

  • 公开/公告日2015-08-12

    原文格式PDF

  • 申请/专利权人 浙江大学;西北大学;

    申请/专利号CN201510080291.4

  • 申请日2015-02-13

  • 分类号G06K9/00(20060101);G06K9/46(20060101);

  • 代理机构61216 西安恒泰知识产权代理事务所;

  • 代理人李郑建;王芳

  • 地址 310028 浙江省杭州市天目山路148号

  • 入库时间 2023-12-18 10:12:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-05

    授权

    授权

  • 2015-09-09

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20150213

    实质审查的生效

  • 2015-08-12

    公开

    公开

说明书

技术领域

本发明涉及图像处理领域,特别涉及一种对书法作品中文字神采信息的提 取方法。

背景技术

中国文化源远流长,在漫长的文化长河中,书法可以称得上是长河中的一 颗明珠。从古至今,无数书法名家写出了不计其数的艺术瑰宝,为我们留下无 数的文化遗产。在对书法作品进行辨别时,需要对书法拥有较高的理解,导致 书法辨别需要靠人工进行。

随着技术的进步,现有的基于计算机的图像识别技术已经日趋完善,通过 将碑文转换成图像后,对文字的边缘进行处理,将处理后的图像进行投影,根 据投影图像对书法作品中的文字进行定位,进而实现文字的提取。

在实现本发明的过程中,发明人发现现有技术至少存在以下问题:

在根据现有技术进行文字提前的过程中,对文字的检测主要依赖于图像的 边缘信息,即主要关注文字的笔划形状等形质信息,没有考虑到颜色、图章等 内容的神采信息,这样会导致检测到的文字信息不够完整,给后期的书法作品 研究工作带来了不便。

发明内容

为了解决现有技术的问题,本发明提供了一种对书法作品中文字神采信息 的提取方法,所述方法包括:

获取待处理书法作品,将所述待处理书法作品的色彩空间转换至预设色彩 空间,得到转换后的待处理书法作品;

提取所述转换后的待处理书法作品中的第一通道数值,根据第一阈值对所 述转换后的待处理书法作品的类型进行区分;

如果所述转换后的待处理书法作品为碑图像,则通过引导滤波器对所述转 换后的待处理书法作品进行处理,得到含有碑图像文字形质信息的图像;

如果所述转换后的待处理书法作品为帖图像,通过所述引导滤波器对所述 转换后的待处理书法作品进行处理,得到含有帖图像中文字形质、神采信息以 及印章形质、神采信息的图像。

可选的,所述提取所述转换后的待处理书法作品中的第一通道数值,根据 第一阈值对所述待处理书法作品的类型进行区分,包括:

对所述转换后的待处理书法作品进行处理,确定所述转换后的待处理书法 作品中的第一通道数值;

根据所述第一通道数值,确定用于区分所述转换后的待处理书法作品中前 景和背景的第一阈值;

如果所述第一通道数值大于或等于第一阈值,则所述转换后的待处理书法 作品为帖图像;

如果所述第一通道数值小于所述第一阈值,则所述转换后的待处理书法作 品为碑图像。

可选的,所述如果所述转换后的待处理书法作品为碑图像,则通过引导滤 波器对所述碑图像进行处理,得到含有碑图像文字形质信息的图像,包括:

根据第二通道数值对所述转换后的待处理书法作品进行二值化处理,得到 二值化的第一模板;

利用引导滤波器对所述转换后的待处理书法作品进行去噪处理,得到去噪 后的平滑模板;

根据所述第一模板,结合所述去噪后的平滑模板,通过所述引导滤波器提 取所述碑图像中文字的形质信息,得到所述含有碑图像文字形质信息的图像。

可选的,所述利用引导滤波器对所述转换后的待处理书法作品进行去噪处 理,得到去噪后的平滑模板,具体包括:

根据第一公式对所述转换后的待处理书法作品进行去噪处理,得到去噪后 的平滑模板,所述第一公式为

Io(x,y)=akIg(x,y)+bk,(x,y)ωk,

其中,IO(x,y)是滤波变换后图像中坐标位置为(x,y)处的像素值,ak和bk是 线性系数,Ig(x,y)是引导图像中坐标位置为(x,y)处的像素值,ωk是以像素点 (x,y)为中心,半径为r的一个局部窗口。

可选的,所述方法还包括:

使用第二公式对所述平滑模板进行二次去噪处理,得到二次去噪后的平滑 模板,所述第二公式为

σn=π216(W-2)(H-2)Σx=1WΣy=1H|I(x,y)*N|,

其中,σn是计算得到的噪声的方差,W和H分别表示图像I的宽度和高度, N为掩模算子。

可选的,如果所述转换后的待处理书法作品为帖图像,通过所述引导滤波 器对所述转换后的待处理书法作品进行处理,得到含有帖图像中文字形质、神 采信息以及印章形质、神采信息的图像,包括:

根据第二通道数值对所述转换后的待处理书法作品进行二值化处理,得到 二值化的第二模板;

根据所述转换后的待处理书法作品中第三通道数值的反相数值,结合预设 的第二阈值,获取所述转换后的待处理书法作品二值化后的第三模板;

结合所述第二模板以及所述第三模板,得到组合模板,结合所述转换后的 待处理图像,通过引导滤波器提取所述帖图像中文字和印章的形质信息以及神 采信息,得到含有帖图像中文字形质、神采信息以及印章形质、神采信息的图 像。

可选的,所述结合所述第二模板以及所述第三模板,得到组合模板,包括:

根据第三公式得到组合模板,所述第三公式为

其中,CS(x,y)是得到的组合模板中坐标为(x,y)处的像素值,C(x,y)是帖 图像中文字的第二模板中坐标为(x,y)处的像素值,S(x,y)是帖图像中印章的第 三模板中坐标为(x,y)处的像素值。

本发明提供的技术方案带来的有益效果是:

通过将待处理书法作品中的色彩空间进行转换,之后根据第一通道阈值对 转换后的待处理书法作品的类型进行区分,根据区分后的是碑图像还是帖图像 分别进行处理,以便得到碑图像中文字形质信息的图像和帖图像中文字和印章 的形质、神采信息的图像,避免了现有技术中仅依靠边缘检测导致的文字信息 不够完整的缺陷,增加了检测到的文字信息的细节表现,提高了对书法作品研 究的便利性。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实 施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。

图1是本发明提供的一种对书法作品中文字神采信息的提取方法的流程示 意图;

图2是本发明提供的一种对书法作品中文字神采信息的提取方法中部分流 程示意图;

图3是本发明提供的种对书法作品中文字神采信息的提取方法中部分流程 示意图;

图4是本发明提供的种对书法作品中文字神采信息的提取方法中部分流程 示意图;

图5是本发明提供的碑图像中文字形质信息的提取结果示意图;

图6是本发明提供的帖图像中文字形质、神采信息以及印章形质、神采信 息的提取结果示意图;

图7是本发明提供的碑图像中使用不同方法提取的文字的形质信息示意图;

图8是本发明提供的帖图像中使用不同方法提取的文字和印章的形质和神 采信息示意图;

图9是本发明提供的帖图像中使用不同方法提取的文字和印章的形质和神 采信息示意图;

图10是本发明提供的由专业人员手工提取的含有文字的真实形质信息的图 像的标准示意图。

具体实施方式

为使本发明的结构和优点更加清楚,下面将结合附图对本发明的结构作进 一步地描述。

实施例一

一种对书法作品中文字神采信息的提取方法,如图1所示,所述方法包括:

101、获取待处理书法作品,将所述待处理书法作品的色彩空间转换至预设 色彩空间,得到转换后的待处理书法作品。

102、提取所述转换后的待处理书法作品中的第一通道数值,根据第一阈值 对所述转换后的待处理书法作品的类型进行区分。

103、如果所述转换后的待处理书法作品为碑图像,则通过引导滤波器对所 述转换后的待处理书法作品进行处理,得到含有碑图像文字形质信息的图像。

104、如果所述转换后的待处理书法作品为帖图像,通过所述引导滤波器对 所述转换后的待处理书法作品进行处理,得到含有帖图像中文字形质、神采信 息以及印章形质、神采信息的图像。

在实施中,常见的书法作品主要分为碑图像和帖图像,顾名思义,碑图像 主要是采集的雕刻在石碑上的文字的图像,通常具有笔锋秀丽、遒劲有力的特 点,而帖图像则是采集书写在纸上的文字的图像,往往帖图像上还有印章等部 分。由于碑图像和帖图像具有不同的特征,因此在获取书法作品中文字神采信 息时,需要根据对象的不同分别处理。

其中涉及到的色彩空间的转换,其实是从常用的色彩空间RGB转换至预设 色彩空间CIE-Lab,CIE L*a*b*(CIE-LAB)是惯常用来描述人眼可见的所有颜 色的最完备的色彩模型。它是为这个特殊目的而由国际照明委员会(Commission  Internationale dEclairage,CIE)提出的。三个基本坐标表示颜色的亮度(L*,L*= 0生成黑色而L*=100指示白色),它在红色/品红色和绿色之间的位置(a*负 值指示绿色而正值指示品红)和它在黄色和蓝色之间的位置(b*负值指示蓝色 而正值指示黄色)。这里之所以使用Lab色彩空间替换原有的RGB色彩空间, 是因为Lab色彩空间具有更高的色彩饱和度,有利于图像的后期处理。

正因为如此,本方法在将待处理的书法作品进行色彩空间的转换后,根据 CIE-Lab色彩空间中第一通道的数值区分转换后的待处理书法作品是碑图像还 是帖图像,在区分完成后通过引导滤波器分别进行文字形质信息图和神采信息 图像的提取。

上述形质信息主要指的是碑图像中的字体在起承转合处的笔划信息,上述 神采信息指的是帖图像中字体的颜色以及印章等信息。

通过上述方法对待处理书法作品进行处理后,能够对待处理的书法作品进 行分类,并且可以根据分类后的具体类型进行后续处理,以便从分类后的书法 作品中提取文字性质信息图像和神采信息图像,增加了在提取书法作品艺术信 息中的抗噪能力,减少计算复杂度高和细节信息缺失严重的问题,提高了书法 作品艺术信息提取的准确性。

可选的,如图2所示,步骤102具体包括:

201、对所述转换后的待处理书法作品进行处理,确定所述转换后的待处理 书法作品中的第一通道数值。

在实施中,在转换后的CIE-Lab色彩空间中,存在三个色彩通道,分别为L 通道、a通道和b通道,这里的第一通道数值指的是b通道的数值。

202、根据所述第一通道数值,确定用于区分所述转换后的待处理书法作品 中前景和背景的第一阈值。

在实施中,使用Otsu(Otsu,该算法发明人姓名)方法对待处理图像的Lab 颜色空间中的b通道计算区分图像前景和背景的最优阈值k,这里的Otsu方法 的原理是利用阈值将原图像分成前景,背景两个图象。

其中:

前景:用来表示在当前阈值下的前景的点数,质量矩,平均灰度等信息;

后景:用来表示在当前阈值下的背景的点数,质量矩,平均灰度等信息。

当取最佳阈值时,背景应该与前景具有最大的差值,而在otsu算法中这个 衡量差别的标准就是最大类间方差。

为了确定用于区分转换后的待处理书法作品中前景和背景的第一阈值,具 体实施步骤如下:

步骤一、使用公式(1)将b通道的像素值从[0,255]归一化到[0,1]:

b(x,y)=b(x,y)255---(1)

其中b(x,y)和b'(x,y)分别表示b通道在坐标为(x,y)处归一化前和归一化后 的像素值。

步骤二、使用公式(2)计算b’通道的平均像素值;

ub=Σx=1,y=1x=M,y=Nb(x,y)M×N---(2)

其中,ub表示归一化后的b通道的平均像素值,b'(x,y)表示b通道在坐标 为(x,y)处归一化后的像素值,M和N分别表示图像的长度和宽度。

这里先假设寻找到的区分前景和背景的最优阈值为k,则通过公式(3)统 计归一化后的b通道中像素值大于k的像素占图像的比例wb,1以及归一化后的b 通道中像素值小于等于k的像素占图像的比例wb,2,并计算归一化后的b通道中 像素值大于k的像素的平均像素值ub,1以及归一化后的b通道中像素值小于等于 k的像素的平均像素值ub,2

wb,1=Wb,1M×N

wb,2=Wb,2M×N

ub,1=Σi×n(i)Wb,1,i>k---(3)

ub,2=Σi×n(i)Wb,2,ik

其中,Wb,1和Wb,2分别表示归一化后的b通道中像素值大于k的像素数和像 素值小于等于k的像素数,i表示图像中像素的像素值,n(i)表示像素值等于i的 像素数。

步骤三、遍历k的每一种可能的取值,使用公式(4)计算类间差异值

Gb=wb,1×(ub,1-ub)2+wb,2×(ub,2-ub)2   (4)

其中,Gb表示二值化处理过程中前景和背景部分两类之间的差异值,当Gb达到最大时,即可得到二值化的最佳阈值。

此时求得的最佳阈值k作为第一阈值即可用于对转换后的待处理书法作品 的类型进行区分。

203、如果所述第一阈值大于或等于预设阈值,则所述转换后的待处理书法 作品为帖图像。

在实施中,例如将预设阈值设置为0.55,则如果第一阈值k大于或等于0.55 时,判定该转换后的待处理书法作品为帖图像。

204、如果所述第一阈值小于所述预设阈值,则所述转换后的待处理书法作 品为碑图像。

在实施中,例如将预设阈值设置为0.55,则如果第一阈值k小于0.55时, 判定该转换后的待处理书法作品为碑图像。

通过上述步骤,就可以将转换后的待处理书法作品完成类型上的区分,以 便于后续的针对性的对形质信息和神采信息的提取。

可选的,如图3所示,步骤103,包括:

301、根据第二通道数值对所述转换后的待处理书法作品进行二值化处理, 得到二值化的第一模板。

在实施中,该步骤301具体包括:

步骤一、使用公式(5)计算L通道的平均像素值,其中L通道的平均像素 值即为第二通道数值;

uL=Σx=1,y=1x=M,y=NL(x,y)M×N---(5)

其中,uL表示L通道的平均像素值,L(x,y)表示L通道在坐标为(x,y)处像 素的像素值,M和N分别表示图像的长度和宽度。

步骤二、假设对碑图像的L通道进行二值化处理的最优阈值为T,则通过 公式(6)统计L通道中像素值大于T的像素占图像的比例wL,1以及L通道中像 素值小于等于T的像素占图像的比例wL,2,并计算L通道中像素值大于T的像 素的平均像素值uL,1以及L通道中像素值小于等于T的像素的平均像素值uL,2

wL,1=WL,1M×N

wL,2=WL,2M×N

uL,1=Σi×n(i)WL,1,i>T---(6)

uL,2=Σi×n(i)WL,2,iT

其中,WL,1和WL,2分别表示L通道中像素值大于T的像素数和像素值小于等 于T的像素数,i表示图像中像素的像素值,n(i)表示像素值等于i的像素数。

步骤三、遍历T的每一种可能的取值,使用公式(7)计算类间差异值

GL=wL,1×(uL,1-uL)2+wL,2×(uL,2-uL)2   (7)

其中,GL表示二值化处理过程中目标部分和背景部分两类之间的差异值, 当GL达到最大时,即可得到二值化的最佳阈值T,然后再使用下式对L通道进 行二值化处理。

根据上述步骤,二值化处理后的图像即为第一模板。

302、利用引导滤波器对所述转换后的待处理书法作品进行去噪处理,得到 去噪后的平滑模板。

在实施中,这里的引导滤波器是根据预设的规则对转换后的待处理书法作 品进行的线性变换,该线性变换能够在保持变换前后图像具有最小的差值,从 而使得在变换后的图像进行去噪处理时能够尽可能的保持与初始图像的一致 性。

该步骤中包含的线性变换以及去噪处理的具体过程如后文所示。

303、根据所述第一模板,结合所述去噪后的平滑模板,通过所述引导滤波 器提取所述碑图像中文字的形质信息,得到所述含有碑图像文字形质信息的图 像。

在实施中,在对碑图像进行文字形质信息提取的过程中,使用碑图像中文 字的形质模板II作为输入图像,平滑图像EE作为引导图像。该过程就是利用平 滑后图像EE(去除了多种噪声)的内容信息对通过二值化得到的形质模板进行 滤波处理(去除形质模板中的散点噪声、非文字连通成分以及模糊边缘等信息), 以保留文字的形质轮廓,得到文字的形质信息。

引导滤波器的基本原理是利用引导图像中的信息对输入图像进行滤波处 理,以得到需要的信息。因此针对不同的目标,所使用的输入图像和引导图像 是不同的。

可选的,所述利用引导滤波器对所述转换后的待处理书法作品进行去噪处 理,得到去噪后的平滑模板,具体包括:

根据第一公式对所述转换后的待处理书法作品进行去噪处理,得到去噪后 的平滑模板,所述第一公式为

Io(x,y)=akIg(x,y)+bk,(x,y)ωk,

其中,IO(x,y)是滤波变换后图像中坐标位置为(x,y)处的像素值,ak和bk是线性 系数,Ig(x,y)是引导图像中坐标位置为(x,y)处的像素值,ωk是以像素点(x,y)为 中心,半径为r的一个局部窗口。

在实施中,根据引导图像中的内容,利用引导滤波器对输入图像进行平滑 处理。例如:以Ii为输入图像,以Ig为引导图像,那么引导滤波器就是对引导图 像的一个线性变换。即:

Io(x,y)=akIg(x,y)+bk,(x,y)ωk

其中,IO(x,y)是滤波变换后图像中坐标位置为(x,y)处的像素值,ak和bk是 线性系数,Ig(x,y)是引导图像中坐标位置为(x,y)处的像素值,ωk是以像素点 (x,y)为中心,半径为r的一个局部窗口。

为了使输入图像和输出图像之间的差异最小,即需要在窗口ωk中使以下的 函数达到最小化:

E=Σ((IO(x,y)-Ii(x,y))2+εak2)=Σ((akIg(x,y)+bk-Ii(x,y))2+εak2),

其中,E是输入图像Ii和输出图像IO之间的差异值,ε是一个防止ak的值过 大的正则化参数。当E达到最小时ak和bk分别为:

ak=(σk2+ϵ)-1(1|ω|Σ(x,y)ωkIg(x,y)Ii(x,y)-μkIik),

bk=Iik-akμk

其中,σk2和μk分别为在局部窗口ωk内Ig(x,y)的均值和方差,为Ii(x,y) 在窗口ωk内的均值,|ω|是窗口ωk内像素点的个数。

由于一个像素可能被多个局部窗口所覆盖,因此,可以根据计算得到的参 数ak和bk,通过以下公式计算得到滤波后的输出图像IO(x,y)。

Io(x,y)=axyIg(x,y)+bxy,

其中,和是覆盖像素(x,y)的所有窗口系数的均 值。

此时的输出图像即为进行去噪处理中得到的平滑模板。

在碑图像的平滑过程中,使用的输入图像和输出图像都是碑图像的第二通 道。因此,该过程是根据第二通道即L通道图像的信息对其自身进行滤波处理, (根据图像自身的信息计算出影响滤波效果的关键参数:局部窗口的半径和正 则化参数,然后利用这些参数进行其自身进行滤波处理),以得到平滑后的图像。

可选的,所述方法还包括:

使用第二公式对所述平滑模板进行二次去噪处理,得到二次去噪后的平滑 模板,所述第二公式为

σn=π216(W-2)(H-2)Σx=1WΣy=1H|I(x,y)*N|,

其中,σn是计算得到的噪声的方差,W和H分别表示图像I的宽度和高度,N 为掩模算子。

在实施中,为了能够使用引导滤波器对图像噪声进行自动平滑处理,本发 明设计了一种自适应引导滤波器。其中,局部窗口ωk的半径r和正则化参数ε是 影响滤波效果的关键因素。而ε和r的值是由图像中噪声的严重程度来决定的, 可以使用以下方法快速估计噪声的严重程度。

为了准确的确定ε和r的数值,首先用以下公式计算噪声的方差:

σn=π216(W-2)(H-2)Σx=1WΣy=1H|I(x,y)*N|

其中,σn是计算得到的噪声的方差,W和H分别表示图像I的宽度和高度, I(x,y)则表示图像I中的每个像素,N是一个具有以下形式的掩模算子:

由于噪声方差σn和窗口ωk的半径r存在r=aσn+b的线性关系,因此可以根 据求出的噪声方差σn,确定半径r。

在将预设参数a和b代入上述公式,可以得到r和σn的具体关系为r=0.2σn

又由于r和σn是非零偶数,因此进一步化简可得到:

而为简化ε和r之间的关系,经过大量数据实验最终确定ε和r之间的关系 为

ϵ=(r20)2,

在该关系下,根据的得到的正则化参数ε和窗口半径r就可以确定自适应滤 波器进行平滑处理的效果。

可选的,如图4所示,步骤104具体包括:

401、根据第二通道数值对所述转换后的待处理书法作品进行二值化处理, 得到二值化的第二模板。

在实施中,具体方式步骤一、第二通道数值为L通道的平均像素值;

uL=Σx=1,y=1x=M,y=NL(x,y)M×N,

其中,uL表示L通道的平均像素值,L(x,y)表示L通道在坐标为(x,y)处像 素的像素值,M和N分别表示图像的长度和宽度。

步骤二、假设对碑图像的L通道进行二值化处理的最优阈值为T,则统计L 通道中像素值大于T的像素占图像的比例wL,1以及L通道中像素值小于等于T 的像素占图像的比例wL,2,并计算L通道中像素值大于T的像素的平均像素值uL,1以及L通道中像素值小于等于T的像素的平均像素值uL,2

wL,1=WL,1M×N

wL,2=WL,2M×N

uL,1=Σi×n(i)WL,1,i>T

uL,2=Σi×n(i)WL,2,iT

其中,WL,1和WL,2分别表示L通道中像素值大于T的像素数和像素值小于等 于T的像素数,i表示图像中像素的像素值,n(i)表示像素值等于i的像素数。

步骤三、遍历T的每一种可能的取值,使用以下公式计算类间差异值

GL=wL,1×(uL,1-uL)2+wL,2×(uL,2-uL)2

其中,GL表示二值化处理过程中目标部分和背景部分两类之间的差异值, 当GL达到最大时,即可得到二值化的最佳阈值T,然后再使用下式对L通道进 行二值化处理。

根据上述步骤,二值化处理后的图像即为第二模板。

402、根据所述转换后的待处理书法作品中第三通道数值的反相数值,结合 预设的第二阈值,获取所述转换后的待处理书法作品二值化后的第三模板。

在实施中,先获取帖图像中各像素在第三通道即a通道的反相数值a'

a'(x,y)=255-a(x,y),

将a'与预设的第二阈值例如110之间的大小关系对a通道进行二值化处理, 得到一幅二值图像,并将其作为帖图像中印章的第三模板S;

其中,S(x,y)是得到的二值图像中坐标为(x,y)处的像素值,a'(x,y)是帖图 像的a通道中坐标为(x,y)处的反相像素值。

403、结合所述第二模板以及所述第三模板,得到组合模板,结合所述转换 后的待处理图像,通过引导滤波器提取所述帖图像中文字和印章的形质信息以 及神采信息,得到含有帖图像中文字形质、神采信息以及印章形质、神采信息 的图像。

在实施中,将帖图像的组合模板作为输入图像,以帖图像的第二通道即L 通道作为引导图像,使用步骤前述的引导滤波器提取帖图像中文字和印章的形 质和神采信息,以得到一副含有文字和印章的形质和神采信息的图像。

在对帖图像进行形质和神采信息提取的过程中,使用帖图像的组合模板作 为输入图像,以帖图像的第二通道作为引导图像。该过程就是利用能够反映黑 色文字的亮度最小特征的通道图像的信息对组合模板进行滤波处理,以得到既 能表达文字轮廓边缘的形质信息,又能表达文字笔画的笔锋和虚实等神采信息, 同样的还包括帖图像中印章的形质信息以及神采信息。

可选的,所述结合所述第二模板以及所述第三模板,得到组合模板,包括:

根据第三公式得到组合模板,所述第三公式为

其中,CS(x,y)是得到的组合模板中坐标为(x,y)处的像素值,C(x,y)是帖 图像中文字的第二模板中坐标为(x,y)处的像素值,S(x,y)是帖图像中印章的第 三模板中坐标为(x,y)处的像素值。

本实施例中提出的一种对书法作品中文字神采信息的提取方法,通过将待 处理书法作品中的色彩空间进行转换,之后根据第一通道阈值对转换后的待处 理书法作品的类型进行区分,根据区分后的是碑图像还是帖图像分别进行处理, 以便得到碑图像中文字形质信息的图像和帖图像中文字形质、神采信息以及印 章形质、神采信息的图像。避免了现有技术中仅依靠边缘检测导致的文字信息 不够完整的缺陷,增加了检测到的文字信息的细节表现,提高了对书法作品研 究的便利性。

为了表明本方法的效果,特地设置了以下对比试验用于表明本方法相对于 现有技术的优越性。

对比试验:

仿真1,对本发明中碑图像和帖图像中文字形质和神采信息提取方法的仿 真。

仿真1的仿真条件是在MATLAB R2010b软件下进行。

参照图5,对5幅著名的具有1000年历史的碑图像进行仿真实验,如图5 中T02和T03所示,这些碑图像由于受到人为的或自然的破坏,给碑图像中文 字的形质信息的提取带来不利的影响。例如:在图5的T03中含有大量的噪声 信息,而使用本发明提出的自适应引导滤波器对原始碑图像进行平滑处理,然 后对平滑后图像再进行二次引导滤波,即可以较为完整、准确地提取出碑图像 中文字的形质信息,如图5中T02,T03,T04和T05所示。

参照图6,对4幅具有1000多年历史的帖图像进行仿真实验。在这些保存 较为完好的帖图像中,“文房四宝”的印记显而易见。如图6所示的模板CS中包 含了文字的主要形质信息和印章的少量形质信息,在图6中W02和W04中较为 明显。然后使用引导滤波器进行进一步滤波处理,不仅可获得更为完整的形质 信息。而且也能将反应神采信息的笔墨浓淡变化和力度变化提取出来。在这些 结果图像中,书法家在书写文字时笔画的虚实以及笔锋的突变和渐变都能够较 好地展示。此外,印章的细节信息也能够较为清晰完整地提取出来。

仿真2,对本发明方法和现有的碑图像和帖图像中文字信息提取方法进行 对比分析的仿真。

仿真2的仿真条件是在MATLAB R2010b软件下进行。引导滤波器的参数 ε=0.110和r=10。本发明方法主要与Otsu’s objective functions(GA-Otsu), two-dimensional(2D)Otsu,Fast Fuzzy C-means(FFCM)以及Fractional-Order  Darwinian Particle Swarm Optimization based image segmentation(FODPSO)进行 对比分析,以证明出本发明方法在书法作品艺术信息提取方面,特别是对帖图 像中文字的神采信息的提取方面具有显著优势。实验结果的对比与分析描述如 下:

参照图7,对于碑图像,主要的目标是降低碑图像中含有的噪声信息,并提 取碑图像中文字的形质信息。在本实验中,选取GA-Otsu,2D Otsu和FFCM与 本发明方法进行对比分析。为统一提取结果的视觉效果,使用Otsu方法对本发 明方法得到的结果进行后处理。如图7所示,由GA-Otsu和FFCM得到的结果 容易受到噪声的干扰,导致提取文字的形质信息不清晰,图7中T02和T03的 结果也表明了这一点,而2D Otsu在含有较小噪声的图像中能够得到更好的效 果。与之形成对比的是在本发明方法得到的结果的基础上进行Otsu后处理的结 果是最好的。图像中含有的各种类型的噪声几乎完全被去除,文字的细节信息 提取的更为完整。

参照图8,对于帖图像,应当同时考虑文字的形质信息和神采信息的提取。 首先,对于文字的形质信息提取方面,如图8所示,所有的方法都能够提取帖 图像中文字的主要形质信息。但是本发明方法能够保持更多的细节信息,如图8 中W01所示。对于印章的提取,如果印章颜色信息中的亮度较高,GA-Otsu,2D  Otsu,和FFCM几乎就不能提取印章信息;随着印章颜色信息中的亮度逐渐变 暗,这三种方法提取的印章信息就越准确,但是所提取到的信息仍旧不完整、 不清晰。然而在任何情况下,本发明方法都可以提取大多数的印章信息,并且 能够保持较多的细节信息。

其次,对于帖图像中文字的神采信息提取方面,本发明方法与使用多种强 度值表达图像的多级图像分割方法(FFCM(c=3),FFCM(c=4),三级FODPSO 和四级FODPSO进行对比分析。如图9所示,FFCM(c=4)和四级FODPSO能 够得到较好的效果,他们不仅能够捕获较多的形质信息,并且能够表达更多的 神采信息,如图9中W03和W04所示。FFCM(c=3)和三级FODPSO虽然含有 较少的噪声信息,但他们在抑制噪声的同时,又丢失了一些有用信息,如在图9 中W01的结果中没有印章信息;并且提取结果粗糙,神采信息不清晰,特别是 没有准确提取出笔墨浓度的变化。与之形成对比的是,本发明方法在形质信息 和神采信息的提取方面具有较高的准确性,如图9中W04所示,笔迹间墨汁的 突变和渐变效果完全被显示出来,并且,几乎所有类型的噪声也被去除。

对于碑图像中文字信息的提取主要关注文字形质信息的提取,为能够对各 方法的实验结果进行定量描述,使用由专业人员手工提取的含有文字的真实形 质信息的图像作为度量标准(如图10所示),并使用错分类误差(misclassification  error(ME))作为度量指标。ME定义如下:

ME=1-|B0BT|+|F0FT||B0|+|F0|

其中B0和F0分别表示含有文字真实形质信息的图像中的背景和前景,BT和 FT表示结果图像中背景和前景的区域像素。|·|表示集合中元素的个数。

如表1所示,本发明方法相对于其他方法在提取结果的准确性方面具有更 好的优越性,本发明方法得到的结果具有最小的ME值。与之形成对比的是, GA-Otsu得到的结果最差,具有最大的ME值(ME值为0.0355)。FFCM比 GA-Otsu较优,而比2D Otsu较差。在实验结果的稳定性方面,本发明方法能够 得到最稳定的结果,它具有最小的标准差(0.0078)。因此,实验结果表明本发 明方法是提取碑图像和帖图像中文字的形质信息最精确最稳定的方法。

表1 基于标准图的不同方法得到结果的ME值

从各仿真实验的结果可以看出,本发明方法使用了引导滤波器,不仅能够 较好地消除图像中存在的多种噪声,而且还能够较准确、完整地提取碑图像和 帖图像中文字的形质和神采信息。与其他文字信息提取方法相比,本发明方法 对于碑图像和帖图像中文字的形质和神采信息的提取具有更好的效果。

需要说明的是:上述实施例提供的提取方法进行文字信息提取的实施例, 仅作为该固定装置中在实际应用中的说明,还可以根据实际需要而将上述提取 方法在其他应用场景中使用,其具体实现过程类似于上述实施例,这里不再赘 述。

上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程 中得先后顺序。

以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神 和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护 范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号