首页> 中国专利> 一种文本内容无关的褶皱中文手写体鉴别方法

一种文本内容无关的褶皱中文手写体鉴别方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提出了一种文本内容无关的褶皱中文手写体鉴别方法，属于字迹鉴别领域。该方法包括：1)将手写体文本扫描后输入到计算机，对得到的手写体图像进行预处理；2)根据手写体图像建立图片数据库；3)对图片数据库中的每张图片进行散射变换，得到其散射系数；4)对散射系数进行拟合，并建立统计模型；5)查找与待鉴别的手写体图像相对应的统计模型；6)计算待鉴别的手写体图像与候选图片之间的KL距离；7)计算识别准确率；8)对实验结果进行对比分析和统计。本发明所采用的方法与现有的技术相比，能够在相同时间的花销下取得较高的识别率；尤其针对褶皱情况下的笔迹识别，能够较好地抵抗褶皱，仍然获得较高的正确识别率。

著录项

公开/公告号CN104077604A

专利类型发明专利
公开/公告日2014-10-01

原文格式PDF
申请/专利权人重庆大学;
展开▼

申请/专利号CN201410341142.4
发明设计人尚赵伟;曹海;张太平;陈波;唐远炎;
展开▼

申请日2014-07-17
分类号G06K9/62;G06F17/30;
代理机构北京同恒源知识产权代理有限公司;
代理人赵荣之
地址 400044 重庆市沙坪坝区沙坪坝正街174号
入库时间 2023-12-17 01:54:18

法律信息

法律状态公告日

法律状态信息

法律状态
2017-05-24

授权

授权
2014-10-29

实质审查的生效 IPC(主分类):G06K9/62 申请日:20140717

实质审查的生效
2014-10-01

公开

公开

说明书

技术领域

本发明涉及字迹鉴别领域，特别涉及一种文本内容无关的褶皱中文手写体鉴别方法。

背景技术

手写体笔迹识别是根据笔迹对书写者进行身份认证的一种基于生物行为识别技术，已在安防、金融等领域得到了广泛的应用，并逐渐成为计算机视觉和模式识别领域中研究的热点。通常根据笔迹是否与文本的内容相关，将其分为与文本相关的脱线笔迹识别和与文本无关的脱线笔迹识别两类。与文本无关的脱线笔迹识别克服了前者与书写内容相关的不足，在实际应用中具有制约少，数据易获取等特点，已得到广泛应用。

与文本无关的脱线笔迹鉴别方法主要有局部特征方法和全局特征方法。局部方法主要通过建立笔迹字典等作为身份鉴别的依据，局部方法对文本图像质量要求较高，通过提取图像的局部特征笔画建立特征库，进行身份鉴别；全局方法将文本图像的内容笔迹视作纹理，提取其纹理特征作为识别依据。20世纪70年代Duverony、Kuckuck认为书写者的笔迹特征变化主要表现在傅里叶谱的低频部分，提出了利用傅里叶变换(FFT)的方法来进行笔迹识别； 1998年Said等提出了应用2D-Gabor结合欧式权距离(WED)分类器来进行笔迹身份识别；2005 年以后，HeZhenyu等提出了轮廓波变换(CT)结合广义高斯分布(GGD)模型的中文笔迹身份识别方法、基于小波分解(DWT)结合GGD模型方法做身份识别和传统金字塔小波变换结合隐马尔科夫树模型(HMT)的方法对中文笔迹进行身份识别；2008年Xu等提出了利用对偶树复小波 (DTCWT)变换和GGD相结合的方法；2011年朱贝贝等提出利用抗混叠轮廓波(NACT)结合GGD[10] 和金字塔复方向滤波器组(PDTDFB)结合GGD的方法。

以上方法处理的数据都是正常情况下获取的文本图像，但是在实际应用中，获取的笔迹文本图像可能是对褶皱纸张扫描后获取的文本图像,因纸张褶皱所产生的笔迹会出现一定程度的平移和局部弹性形变，造成相同的文本图像存在一定的视觉差异，笔迹产生了局部平移和局部形变等变化，局部特征方法进行笔迹鉴别时，需对文本图像进行二值化处理，褶皱的笔迹图像由于形变对二值化图像的影响结果较大，且这种影响是随机的和不确定的，使得局部特征方法提取的笔画特征表示的特征质量降低，因此局部特征方法难以处理褶皱笔迹鉴别，所以对褶皱中文笔迹身份进行鉴别，其描述特征应具有局部平移不变性和局部形变稳定性。上述方法所描述的特征不具有局部平移不变性和局部形变稳定性，均难以处理褶皱情况下的笔迹鉴别，因此褶皱中文手写体鉴别方法的研究非常有意义。

发明内容

有鉴于此，本发明的目的在于克服上述不足，提供一种文本内容无关的褶皱中文手写体鉴别方法，该方法通过利用散射变换的平移不变性和弹性形变稳定性，较好的解决了褶皱情况下的笔迹识别问题。

本发明的目的是通过以下技术方案实现的：

一种文本内容无关的褶皱中文手写体鉴别方法，包括以下步骤：

1)将手写体文本扫描后输入到计算机，并对扫描后得到的手写体图像进行预处理；

2)根据手写体图像建立图片数据库；

3)对图片数据库中的每张图片进行散射变换，得到其散射系数；

4)对散射系数进行拟合，得到图片对应的拟合参数α、β，并建立统计模型；

5)查找与待鉴别的手写体图像相对应的统计模型；

6)计算待鉴别的手写体图像与候选图片之间的KL距离；

7)计算识别准确率；

8)对实验结果进行对比分析和统计。

进一步的，步骤1)中所所述的对自己图像进行预处理包括以下步骤：

1-1)除去手写体图像中的噪声和无关字符；

1-2)用定位文本行和投影的方法对单独的字符分割；

1-3)把每个字符归一化为大小相同的尺寸，并将这些手写体字符组合成手写体图像。

进一步的，步骤2)中所述的根据手写体图像建立图片数据库：

选取n个书写者的2n幅手写体文本作为实验对象，且每两幅手写体文本来自同一书写者；在原手写体图像的基础上，以字符为单位随机排列，使一幅手写体图像分割形成了m幅图片，最终形成具有2nm幅图片的数据库。

进一步的，n不小于30；m不小于10。

进一步的，步骤3)中所述散射变换的方法为：

在散射变换中第一阶散射变换的构造如下：

|f*ψ_j,γ|*φ_J(x) (1)

其中：f为图片，*表示卷积操作，ψ_j,γ(x)＝2^-2jψ(2^-jR_γx)为小波，j,γ分别为尺度和方向， φ_J(x)＝2^-2Jφ(2^-Jx)为低通滤波器；

因低通滤波器φ_J作用，将会导致高频信息的损失,对小波模进行新的小波再分解,恢复高频信息，如式(2)：

$| | f * ψ_{j_{1}, γ_{1}} | * ψ_{j_{2}, γ_{2}} | * φ_{J} (x) - - - (2)$

公式(2)中丢失的高频信息又可通过下一轮的小波再分解得以恢复，则第q阶散射变换为：

$S_{q, J} f (x) = {(| | | f * ψ_{j_{1}, γ_{1}} | * . . . * | ψ_{j_{q}, γ_{q}} | * φ_{J} (x))}_{\underset{(γ_{1}, . . ., γ_{q}) \in Γ^{q}}{j_{1} < . . . < j_{q} < J}} - - - (3)$

其中：S_q,Jf(x)为在q阶、J个尺度下的散射系数；J为散射变换的尺度数；Γ^q为1到q 各个阶层上的变换方向数集合；

散射表达包括所有尺度和方向的散射系数，即：

$S_{J} f (x) = Σ_{q = 0}^{m} S_{q, J} f (x) - - - (4)$

若小波变换的方向数为C，则第q阶散射变换沿频率递减的路径数为 $C^{q} (\begin{matrix} J \\ q \end{matrix}),$ 前q阶的路径总数为 $Σ_{q = 0}^{m} C^{q} (\begin{matrix} J \\ q \end{matrix});$ 设图片的像素大小为N，采样值为ω2^J(＝1或0.5)，则每条散射路径有 Nω^-22^-2J个散射系数；

则前q阶散射系数的总数，即散射算子的系数为： ${Nω}^{- 2} 2^{- 2 J} Σ_{q = 0}^{m} C^{q} (\begin{matrix} J \\ q \end{matrix}) .$

进一步的，步骤4)中对散射系数进行拟合的方法为Gamma拟合，且得到的拟合参数α为尺度参数，用于模拟了概率密度函数峰值的宽度；拟合参数β为形状参数，用于模拟反比例于定点的下降速率。

进一步的，步骤6)所述的计算待鉴别的手写体图像与候选图片之间的KL距离的方法为：

$\underset{Gamma}{{KL}_{ij}} = ψ (α_{i}) (α_{i} - α_{j}) - α_{i} + \log (\frac{β_{j}}{β_{i}}) + \frac{α_{i} β_{i}}{β_{j}} - - - (5)$

其中：ψ为双伽玛函数，α_i、β_i为待鉴别的手写体图像i所对应的拟合参数；α_j、β_j为图片数据库中的图片j对应的拟合参数。

进一步的，步骤7)所述计算识别准确率的方法为：

$S = \frac{1}{M} Σ_{i = 1}^{M} R_{i} / K - - - (6)$

其中：K表示属于同一个书写者的图片数目；R_i表示每次KL计算结果中，前K个距离最小且与被鉴别的手写体图像属于同一个书写者的图片数目；M表示所有待鉴别的手写体图像数目。

本发明的优点在于：本发明所采用的方法与现有的技术相比，能够在相同时间的花销下取得较高的识别率。尤其针对褶皱情况下的笔迹识别，本发明能够较好地抵抗褶皱，仍然获得较高的正确识别率，优于现有的技术。

本发明的其它优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其它优点可以通过下面的说明书，权利要求书，以及附图中所特别指出的结构来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步的详细描述，其中：

图1为本发明一种文本内容无关的褶皱中文手写体鉴别方法的流程图；

图2为本发明的散射变换方法的框架图。

具体实施方式

以下是本发明优选实施例的详细描述，应当理解，优选实施例仅为了说明本发明，而不是为了限制本发明的保护范围。

图1为本发明一种文本内容无关的褶皱中文手写体鉴别方法的流程图；参照图1，一种文本内容无关的褶皱中文手写体鉴别方法，包括以下步骤：

1)将手写体文本扫描后输入到计算机，并对扫描后得到的手写体图像进行预处理；

2)根据手写体图像建立图片数据库；

3)对图片数据库中的每张图片进行散射变换，得到其散射系数；

4)对散射系数进行拟合，得到图片对应的拟合参数α、β，并建立统计模型；

5)查找与待鉴别的手写体图像相对应的统计模型；

6)计算待鉴别的手写体图像与候选图片之间的KL距离；

7)计算识别准确率；

8)对实验结果进行对比分析和统计。

步骤1)中所所述的对自己图像进行预处理包括以下步骤：

1-1)除去手写体图像中的噪声和无关字符；

1-2)用定位文本行和投影的方法对单独的字符分割；

1-3)把每个字符归一化为大小相同的尺寸，并将这些手写体字符组合成手写体图像。

步骤2)中所述的根据手写体图像建立图片数据库：

n不小于30；m不小于10。

图2为本发明的散射变换方法的框架图，参照图2，步骤3)中所述散射变换的方法为：

在散射变换中第一阶散射变换的构造如下：

|f*ψ_j,γ|*φ_J(x) (1)

其中：f为图片，*表示卷积操作，ψ_j,γ(x)＝2^-2jψ(2^-jR_γx)为小波，j,γ分别为尺度和方向， φ_J(x)＝2^-2Jφ(2^-Jx)为低通滤波器；

因低通滤波器φ_J作用，将会导致高频信息的损失,对小波模进行新的小波再分解,恢复高频信息，如式(2)：

$| | f * ψ_{j_{1}, γ_{1}} | * ψ_{j_{2}, γ_{2}} | * φ_{J} (x) - - - (2)$

公式(2)中丢失的高频信息又可通过下一轮的小波再分解得以恢复，则第q阶散射变换为：

$S_{q, J} f (x) = {(| | | f * ψ_{j_{1}, γ_{1}} | * . . . * | ψ_{j_{q}, γ_{q}} | * φ_{J} (x))}_{\underset{(γ_{1}, . . ., γ_{q}) \in Γ^{q}}{j_{1} < . . . < j_{q} < J}} - - - (3)$

其中：S_q,Jf(x)为在q阶、J个尺度下的散射系数；J为散射变换的尺度数；Γ^q为1到q 各个阶层上的变换方向数集合；

散射表达包括所有尺度和方向的散射系数，即：

$S_{J} f (x) = Σ_{q = 0}^{m} S_{q, J} f (x) - - - (4)$

则前q阶散射系数的总数，即散射算子的系数为： ${Nω}^{- 2} 2^{- 2 J} Σ_{q = 0}^{m} C^{q} (\begin{matrix} J \\ q \end{matrix}) .$

步骤4)中对散射系数进行拟合的方法为Gamma拟合，且得到的拟合参数α为尺度参数，用于模拟了概率密度函数峰值的宽度；拟合参数β为形状参数，用于模拟反比例于定点的下降速率。

步骤6)所述的计算待鉴别的手写体图像与候选图片之间的KL距离的方法为：

$\underset{Gamma}{{KL}_{ij}} = ψ (α_{i}) (α_{i} - α_{j}) - α_{i} + \log (\frac{β_{j}}{β_{i}}) + \frac{α_{i} β_{i}}{β_{j}} - - - (5)$

其中：ψ为双伽玛函数，α_i、β_i为待鉴别的手写体图像i所对应的拟合参数；α_j、β_j为图片数据库中的图片j对应的拟合参数。

步骤7)所述计算识别准确率的方法为：

$S = \frac{1}{M} Σ_{i = 1}^{M} R_{i} / K - - - (6)$

运用本发明的方法(Scatter)与抗混叠轮廓波(NACT)方法、金字塔复方向滤波器组 (PDTDFB)方法、轮廓波方法(CTY)作对比，对比数据见下表：

由该表可见，本发明在处理无褶皱情况的文本图片的检索率并没有明显优于另外三种方法，但是在文本出现轻度褶皱甚至是重度褶皱的情况时，本发明的处理效果要明显优于其他，在平均检索率上也高达73.9％，比抗混叠轮廓波(NACT)方法的57.1％、金字塔复方向滤波器组(PDTDFB)方法的49.84％、轮廓波方法(CT)的48.68％要高很多。

本发明最后说明的是，以上优选实施例仅用以说明本发明的技术方案而非限制，尽管通过上述优选实施例已经对本发明进行了详细的描述，但本领域技术人员应当理解，可以在形式上和细节上对其作出各种各样的改变，而不偏离本发明权利要求书所限定的范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种文本内容无关的褶皱中文手写体鉴别方法 [P] . 中国专利： CN104077604B . 2017.05.24
2. 一种文本内容无关的褶皱中文手写体鉴别方法 [P] . 中国专利： CN104077604A . 2014-10-01
3. System and method for identifying the existence and position of text in visual media content and for determining a subject's interactions with the text [P] . 美国专利： US8814357B2 . 2014-08-26

机译：用于识别视觉媒体内容中文本的存在和位置以及确定对象与文本的交互的系统和方法
4. System and method for identifying the existence and position of text in visual media content and for determining a subjects interactions with the text [P] . 美国专利： US8136944B2 . 2012-03-20

机译：用于识别视觉媒体内容中文本的存在和位置以及确定主题与文本交互的系统和方法
5. SYSTEM AND METHOD FOR IDENTIFYING THE EXISTENCE AND POSITION OF TEXT IN VISUAL MEDIA CONTENT AND FOR DETERMINING A SUBJECT'S INTERACTIONS WITH THE TEXT [P] . 美国专利： US2012237084A1 . 2012-09-20

机译：用于识别视觉媒体内容中文本的存在和位置以及确定对象与文本的交互的系统和方法