法律状态公告日
法律状态信息
法律状态
2017-05-24
授权
授权
2014-10-29
实质审查的生效 IPC(主分类):G06K9/62 申请日:20140717
实质审查的生效
2014-10-01
公开
公开
技术领域
本发明涉及字迹鉴别领域,特别涉及一种文本内容无关的褶皱中文手写体鉴别方法。
背景技术
手写体笔迹识别是根据笔迹对书写者进行身份认证的一种基于生物行为识别技术,已在 安防、金融等领域得到了广泛的应用,并逐渐成为计算机视觉和模式识别领域中研究的热点。 通常根据笔迹是否与文本的内容相关,将其分为与文本相关的脱线笔迹识别和与文本无关的 脱线笔迹识别两类。与文本无关的脱线笔迹识别克服了前者与书写内容相关的不足,在实际 应用中具有制约少,数据易获取等特点,已得到广泛应用。
与文本无关的脱线笔迹鉴别方法主要有局部特征方法和全局特征方法。局部方法主要通 过建立笔迹字典等作为身份鉴别的依据,局部方法对文本图像质量要求较高,通过提取图像 的局部特征笔画建立特征库,进行身份鉴别;全局方法将文本图像的内容笔迹视作纹理,提 取其纹理特征作为识别依据。20世纪70年代Duverony、Kuckuck认为书写者的笔迹特征变 化主要表现在傅里叶谱的低频部分,提出了利用傅里叶变换(FFT)的方法来进行笔迹识别; 1998年Said等提出了应用2D-Gabor结合欧式权距离(WED)分类器来进行笔迹身份识别;2005 年以后,HeZhenyu等提出了轮廓波变换(CT)结合广义高斯分布(GGD)模型的中文笔迹身份识 别方法、基于小波分解(DWT)结合GGD模型方法做身份识别和传统金字塔小波变换结合隐马尔 科夫树模型(HMT)的方法对中文笔迹进行身份识别;2008年Xu等提出了利用对偶树复小波 (DTCWT)变换和GGD相结合的方法;2011年朱贝贝等提出利用抗混叠轮廓波(NACT)结合GGD[10] 和金字塔复方向滤波器组(PDTDFB)结合GGD的方法。
以上方法处理的数据都是正常情况下获取的文本图像,但是在实际应用中,获取的笔迹 文本图像可能是对褶皱纸张扫描后获取的文本图像,因纸张褶皱所产生的笔迹会出现一定程 度的平移和局部弹性形变,造成相同的文本图像存在一定的视觉差异,笔迹产生了局部平移 和局部形变等变化,局部特征方法进行笔迹鉴别时,需对文本图像进行二值化处理,褶皱的 笔迹图像由于形变对二值化图像的影响结果较大,且这种影响是随机的和不确定的,使得局 部特征方法提取的笔画特征表示的特征质量降低,因此局部特征方法难以处理褶皱笔迹鉴别, 所以对褶皱中文笔迹身份进行鉴别,其描述特征应具有局部平移不变性和局部形变稳定性。 上述方法所描述的特征不具有局部平移不变性和局部形变稳定性,均难以处理褶皱情况下的 笔迹鉴别,因此褶皱中文手写体鉴别方法的研究非常有意义。
发明内容
有鉴于此,本发明的目的在于克服上述不足,提供一种文本内容无关的褶皱中文手写体 鉴别方法,该方法通过利用散射变换的平移不变性和弹性形变稳定性,较好的解决了褶皱情 况下的笔迹识别问题。
本发明的目的是通过以下技术方案实现的:
一种文本内容无关的褶皱中文手写体鉴别方法,包括以下步骤:
1)将手写体文本扫描后输入到计算机,并对扫描后得到的手写体图像进行预处理;
2)根据手写体图像建立图片数据库;
3)对图片数据库中的每张图片进行散射变换,得到其散射系数;
4)对散射系数进行拟合,得到图片对应的拟合参数α、β,并建立统计模型;
5)查找与待鉴别的手写体图像相对应的统计模型;
6)计算待鉴别的手写体图像与候选图片之间的KL距离;
7)计算识别准确率;
8)对实验结果进行对比分析和统计。
进一步的,步骤1)中所所述的对自己图像进行预处理包括以下步骤:
1-1)除去手写体图像中的噪声和无关字符;
1-2)用定位文本行和投影的方法对单独的字符分割;
1-3)把每个字符归一化为大小相同的尺寸,并将这些手写体字符组合成手写体图像。
进一步的,步骤2)中所述的根据手写体图像建立图片数据库:
选取n个书写者的2n幅手写体文本作为实验对象,且每两幅手写体文本来自同一书写者; 在原手写体图像的基础上,以字符为单位随机排列,使一幅手写体图像分割形成了m幅图片, 最终形成具有2nm幅图片的数据库。
进一步的,n不小于30;m不小于10。
进一步的,步骤3)中所述散射变换的方法为:
在散射变换中第一阶散射变换的构造如下:
|f*ψj,γ|*φJ(x) (1)
其中:f为图片,*表示卷积操作,ψj,γ(x)=2-2jψ(2-jRγx)为小波,j,γ分别为尺度和方向, φJ(x)=2-2Jφ(2-Jx)为低通滤波器;
因低通滤波器φJ作用,将会导致高频信息的损失,对小波模进行新的小波再分解,恢复高 频信息,如式(2):
公式(2)中丢失的高频信息又可通过下一轮的小波再分解得以恢复,则第q阶散射变换 为:
其中:Sq,Jf(x)为在q阶、J个尺度下的散射系数;J为散射变换的尺度数;Γq为1到q 各个阶层上的变换方向数集合;
散射表达包括所有尺度和方向的散射系数,即:
若小波变换的方向数为C,则第q阶散射变换沿频率递减的路径数为
则前q阶散射系数的总数,即散射算子的系数为:
进一步的,步骤4)中对散射系数进行拟合的方法为Gamma拟合,且得到的拟合参数α为 尺度参数,用于模拟了概率密度函数峰值的宽度;拟合参数β为形状参数,用于模拟反比例于 定点的下降速率。
进一步的,步骤6)所述的计算待鉴别的手写体图像与候选图片之间的KL距离的方法为:
其中:ψ为双伽玛函数,αi、βi为待鉴别的手写体图像i所对应的拟合参数;αj、βj为图 片数据库中的图片j对应的拟合参数。
进一步的,步骤7)所述计算识别准确率的方法为:
其中:K表示属于同一个书写者的图片数目;Ri表示每次KL计算结果中,前K个距离最 小且与被鉴别的手写体图像属于同一个书写者的图片数目;M表示所有待鉴别的手写体图像 数目。
本发明的优点在于:本发明所采用的方法与现有的技术相比,能够在相同时间的花销下 取得较高的识别率。尤其针对褶皱情况下的笔迹识别,本发明能够较好地抵抗褶皱,仍然获 得较高的正确识别率,优于现有的技术。
本发明的其它优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某 种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发 明的实践中得到教导。本发明的目标和其它优点可以通过下面的说明书,权利要求书,以及 附图中所特别指出的结构来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的 详细描述,其中:
图1为本发明一种文本内容无关的褶皱中文手写体鉴别方法的流程图;
图2为本发明的散射变换方法的框架图。
具体实施方式
以下是本发明优选实施例的详细描述,应当理解,优选实施例仅为了说明本发明,而 不是为了限制本发明的保护范围。
图1为本发明一种文本内容无关的褶皱中文手写体鉴别方法的流程图;参照图1,一种 文本内容无关的褶皱中文手写体鉴别方法,包括以下步骤:
1)将手写体文本扫描后输入到计算机,并对扫描后得到的手写体图像进行预处理;
2)根据手写体图像建立图片数据库;
3)对图片数据库中的每张图片进行散射变换,得到其散射系数;
4)对散射系数进行拟合,得到图片对应的拟合参数α、β,并建立统计模型;
5)查找与待鉴别的手写体图像相对应的统计模型;
6)计算待鉴别的手写体图像与候选图片之间的KL距离;
7)计算识别准确率;
8)对实验结果进行对比分析和统计。
步骤1)中所所述的对自己图像进行预处理包括以下步骤:
1-1)除去手写体图像中的噪声和无关字符;
1-2)用定位文本行和投影的方法对单独的字符分割;
1-3)把每个字符归一化为大小相同的尺寸,并将这些手写体字符组合成手写体图像。
步骤2)中所述的根据手写体图像建立图片数据库:
选取n个书写者的2n幅手写体文本作为实验对象,且每两幅手写体文本来自同一书写者; 在原手写体图像的基础上,以字符为单位随机排列,使一幅手写体图像分割形成了m幅图片, 最终形成具有2nm幅图片的数据库。
n不小于30;m不小于10。
图2为本发明的散射变换方法的框架图,参照图2,步骤3)中所述散射变换的方法为:
在散射变换中第一阶散射变换的构造如下:
|f*ψj,γ|*φJ(x) (1)
其中:f为图片,*表示卷积操作,ψj,γ(x)=2-2jψ(2-jRγx)为小波,j,γ分别为尺度和方向, φJ(x)=2-2Jφ(2-Jx)为低通滤波器;
因低通滤波器φJ作用,将会导致高频信息的损失,对小波模进行新的小波再分解,恢复高 频信息,如式(2):
公式(2)中丢失的高频信息又可通过下一轮的小波再分解得以恢复,则第q阶散射变换 为:
其中:Sq,Jf(x)为在q阶、J个尺度下的散射系数;J为散射变换的尺度数;Γq为1到q 各个阶层上的变换方向数集合;
散射表达包括所有尺度和方向的散射系数,即:
若小波变换的方向数为C,则第q阶散射变换沿频率递减的路径数为
则前q阶散射系数的总数,即散射算子的系数为:
步骤4)中对散射系数进行拟合的方法为Gamma拟合,且得到的拟合参数α为尺度参数, 用于模拟了概率密度函数峰值的宽度;拟合参数β为形状参数,用于模拟反比例于定点的下降 速率。
步骤6)所述的计算待鉴别的手写体图像与候选图片之间的KL距离的方法为:
其中:ψ为双伽玛函数,αi、βi为待鉴别的手写体图像i所对应的拟合参数;αj、βj为图 片数据库中的图片j对应的拟合参数。
步骤7)所述计算识别准确率的方法为:
其中:K表示属于同一个书写者的图片数目;Ri表示每次KL计算结果中,前K个距离最 小且与被鉴别的手写体图像属于同一个书写者的图片数目;M表示所有待鉴别的手写体图像 数目。
运用本发明的方法(Scatter)与抗混叠轮廓波(NACT)方法、金字塔复方向滤波器组 (PDTDFB)方法、轮廓波方法(CTY)作对比,对比数据见下表:
由该表可见,本发明在处理无褶皱情况的文本图片的检索率并没有明显优于另外三种方 法,但是在文本出现轻度褶皱甚至是重度褶皱的情况时,本发明的处理效果要明显优于其他, 在平均检索率上也高达73.9%,比抗混叠轮廓波(NACT)方法的57.1%、金字塔复方向滤波 器组(PDTDFB)方法的49.84%、轮廓波方法(CT)的48.68%要高很多。
本发明最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通 过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形 式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
机译: 用于识别视觉媒体内容中文本的存在和位置以及确定对象与文本的交互的系统和方法
机译: 用于识别视觉媒体内容中文本的存在和位置以及确定主题与文本交互的系统和方法
机译: 用于识别视觉媒体内容中文本的存在和位置以及确定对象与文本的交互的系统和方法