首页> 中国专利> 一种基于纹理特征识别具有字迹污损人民币的方法

一种基于纹理特征识别具有字迹污损人民币的方法

摘要

本发明涉及的一种基于纹理特征提取识别具有字迹污损人民币的方法,其特征在于:采用局部二值模式(简称“LBP”)对人民币图像进行LBP编码,滤除大部分人民币图像背景;采用矩形窗口滑动生长,确定文字域大小;文字区域过大,则判定为字迹污损币。

著录项

  • 公开/公告号CN104200561A

    专利类型发明专利

  • 公开/公告日2014-12-10

    原文格式PDF

  • 申请/专利权人 华中科技大学;

    申请/专利号CN201410266972.5

  • 申请日2014-06-16

  • 分类号G07D7/20;

  • 代理机构上海硕力知识产权代理事务所;

  • 代理人王法男

  • 地址 430074 湖北省武汉市洪山区珞喻路1037号

  • 入库时间 2023-12-17 03:22:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-06-20

    授权

    授权

  • 2015-01-07

    实质审查的生效 IPC(主分类):G07D7/20 申请日:20140616

    实质审查的生效

  • 2014-12-10

    公开

    公开

说明书

技术领域

本发明涉及纸币鉴别技术,具体地说是一种基于纹理特征识别具有字迹污损人民币的方法。 

背景技术

近年来,国内字迹污损币大量流通;这些字迹不仅包括手写字体,还包括各种广告宣传,甚至反动人员的反动宣传,这些字迹污损币不断流入市场,从刚开始多集中于1元纸币上,逐渐发展到20元,且有不断增加的趋势。有些字迹污损币对社会的危害较大,例如,反动宣传币不但具有反政治目的、破坏社会稳定,而且破坏了人民币的社会信誉和金融秩序。虽然国家和银行制定了一系列政策,如银行柜台人员对收到的反动宣传币进行回收,群众在消费过程中可拒收,但一方面由于银行的点验钞机和清分机没有识别字迹污损人民币的功能,且人工清分效率过低,使得字迹污损币回收难度很大;另一方面由于印有反动字样的人民币是真币,群众对于拒收反动宣传币的意识低,使得国家无法及时阻止反动宣传币在市场上流通。由于字迹污损币识别的主要技术难点在于:识别速度要求高、字迹字样位置不固定、字样内容、字体不固定。在准确识别字迹污损币的同时还要保证算法对纸币折旧的鲁棒性,以便电子清币机对纸币实施正常的辨认。 

鉴于目前还没有清分机和点验钞机能够有效识别字迹污损币,为了维护人民币信誉、维护国家金融稳定,有必要提出一种应用于点钞机和清分机针对此类污损人民币的识别方法。 

发明内容

本发明的目的在于:提供一种计算量小;对印刷文字污损和无印刷文字污损纸币区分度高;可移植性很好的识别具有字迹污损人民币特别是具有印刷字迹污损人民币的识别方法。 

上述发明目的通过以下技术方案实现: 

这种基于纹理特征提取识别具有字迹污损人民币的方法,其特征在于:首先将人民币进行预处理;随后采用“LBP”对人民币图像进行LBP编码,滤除大部分人民币图像背景;而后采用矩形窗口滑动生长,确定文字区域大小;文字区域过大则判定为字迹污损币;具体步骤为: 

步骤一: 

(A)将待识别的人民币送入多光谱点验钞机; 

(B)将步骤(A)所述的纸币通过多光谱点钞机的高速图像扫描装置获取纸币的正面、反面两幅图像;图像在嵌入式系统中是以8位二进制即256个灰度等级以矩阵的形式进行表示的,为了能够对两幅图像进行同时处理,将正反两面图像合成一幅图像,即: 

其中:A、B分别示纸币正反两幅图; 

M1,N1分别代表正反两幅图像矩阵的行数和列数; 

M,N分别代表合并后图像矩阵的行数和列数; 

(C)将步骤(B)获得的图像进行LBP编码,为了适应字符的纹理特性和字符的一些笔划特征,采用的LBP算子为一个3×3的矩阵元,将其应用于人民币图像上的字符提取;所述LBP编码的计算方式如下: 

LBP(xc,yc)=Σi=0K-1s(g)2k

其中s(g)=1|gi-gc|>ϵ0|gi-gc|ϵ

(xc,yc)表示LBP算子矩阵元中心点坐标; 

gc为像素灰度值; 

i为中心点周围的8邻域像素; 

gi为像素值; 

N为周围像素个数; 

K=8,K代表中心像素周围8个邻近像素点的序号; 

这个序号的排列的次序为:以中心点为基点向八个邻近像素点画向量,角度与水平中心轴的夹角进行从小到大排列如下所示: 

8     7     6 

1  (xc,yc)  5 

2     3     4 

ε所代表的是二值化的阈值,它不是一个固定的值,而是一个自适应的阈值。 

步骤二:根据印刷字符的密度和经验提取非人民币印刷文字所在的区域,经过步骤1得到LBP编码后的图像,LBP编码后的图像在有字符区域,像素的灰度值比较高,非文字区域像素的灰度值比较低,但仍然存在少量的背景噪声,为了去掉这些非文字区域的噪声,采用一个矩形滑动窗口将非背景噪声去除掉;根据印刷字体具有水平排版性和垂直排版性,采用矩形窗口向右生长和向下生长的方法定位出文字所在的区域;印刷在纸币上在的文字大小为最小值为12×12,因此这里采用的矩形窗口大小为12×12即初始值H=12,W=12W; 

具体处理步骤如下: 

(A)依照averageGrayValue=Σi=0HΣj=0WLBP(xi,yi)寻找文字所在的区域的开始 位置; 

这里LBP(xi,yi)指窗口所覆盖区域像素的LBP编码值; 

(B)判断该窗口覆盖区域是否为文字区域; 

根据实验数据averageGrayValue>134则表示该区域为文字区域; 

(C)如果找到了文字区域,为了确定文字区域的大小,需要对窗口放大;令H=H+1,W=W+1,重复步骤(A),(B),直到不满足步骤(B)中的条件为止,表示找到一个文字区域,并令H,W恢复初始值,保存文字区域大小Zone=Zone+(H-1)*(W-1),这里Zone的初始值为0; 

(D)将窗口移动至未被遍历的区域,重复步骤(A)、(B)、(C)直至滑动窗口遍历整幅人民币图像; 

(E)因为人民币本身印刷有“中国人民银行”,“冠字号”等字样,进行判断此币是否印刷有其它文字,且为了保证稳定性,本发明对具有字迹污损的人民币判断如下: 

Zone≤500则为正常纸币,否则为字迹污损币。 

所述阈值ε的确定方法为:对整幅人民币图像的每个像素值进行求值,再获取平均值: 

areaAverage=Σi=0M-1Σj=0N-1I(i,j)M×N

利用求得的灰度平均值去掉部分背景,计算人民币灰度图像的每个像素值与平均像素值的差值的绝对值之和,并求其平均值: 

DaverageValue=Σi=0MΣj=0N|I(i,j)-averageValue|M×N

利用局部特征去除背景。用3×3大小的滑动窗口,遍历图像,求取中心像素灰度值与周边像素灰度值之差,在每一个窗口图像内求取平均值: 

Average=Σi=07|gi-gc|8

根据实验数据,拟合计算自适应阈值方法: 

ϵ=3.82×DaverageValue+Areaverage.

根据以上技术方案提出这种基于纹理特征提取识别具有字迹污损人民币的方法,其优点是: 

1.利用文字图像的纹理特征有效去除背景; 

2.算法计算量小,鉴别速度快,可以满足实时要求; 

3.可有效识别印刷有其它文字的污损人民币,特别是具有印刷字体的污损币。 

4.适用于人民币的各种面额。 

附图说明

图1为本发明基于纹理特征提取识别有涂鸦文字或污损币的方法流程图; 

图2为10元字迹污损币点验钞机采集的灰度图像; 

图3为10元字迹污损币LBP编码图像经过窗口滑动生长得到文字区域标记图像。 

具体实施方式

这种基于纹理特征提取识别具有字迹污损人民币的方法,其特征在于:首先将人民币进行预处理;随后采用“LBP”对人民币图像进行LBP编码,滤除大部分人民币图像背景;而后采用矩形窗口滑动生长,确定文字区域大小;文字区域过大则判定为字迹污损币。这里的纹理特征提取主要采用局部二值模式(Local Binary Patterns,简称“LBP”);LBP是一种简单、有效的纹理分类的特征提取算法;图像上某个像素点的纹理牲,大多数情况 下是指这个点和它周围点的关系,也就是说这个点和它邻域内点的关系,而LBP正好构造了一种衡量一个像素点和它周围像素点的关系。LBP(局部二值模式)是一种有效的局部纹理描述算子,它可以对灰度图像中局部邻域的纹理信息进行度量和提取。由于LBP算子强大的纹理判别能力和计算简单的特点,它已经应用于视频文字定位、图片文字定位。 

具体步骤为: 

步骤一: 

(A)将待识别的人民币送入多光谱点验钞机; 

(B)将步骤(A)所述的纸币通过多光谱点钞机的高速图像扫描装置获取纸币的正面、反面两幅图像;图像在嵌入式系统中是以8位二进制即256个灰度等级以矩阵的形式进行表示的,为了能够对两幅图像进行同时处理,将正反两面图像合成一幅图像,即: 

其中:A、B分别示纸币正反两幅图; 

M1,N1分别代表正反两幅图像矩阵的行数和列数; 

M,N分别代表合并后图像矩阵的行数和列数; 

(C)将步骤(B)获得的图像进行LBP编码,为了适应字符的纹理特性和字符的一些笔划特征,采用的LBP算子为一个3×3的矩阵元,将其应用于人民币图像上的字符提取;所述LBP编码的计算方式如下: 

LBP(xc,yc)=Σi=0K-1s(g)2k

其中s(g)=1|gi-gc|>ϵ0|gi-gc|ϵ

(xc,yc)表示LBP算子矩阵元中心点坐标; 

像素灰度值为gc; 

i为中心点周围的8邻域像素; 

像素值为gi; 

N为周围像素个数; 

K=8,K代表中心像素周围8个邻近像素点的序号; 

这个序号的排列的次序为:以中心点为基点向八个邻近像素点画向量,角度与水平中心轴的夹角进行从小到大排列如下所示: 

8     7     6 

1  (xc,yc)  5 

2     3     4 

ε所代表的是二值化的阈值,它不是一个固定的值,而是一个自适应的阈值;所述阈值ε的确定方法为:对整幅人民币图像的每个像素值进行求值,再获取平均值: 

areaAverage=Σi=0M-1Σj=0N-1I(i,j)M×N

利用求得的灰度平均值去掉部分背景,计算人民币灰度图像的每个像素值与平均像素值的差值的绝对值之和,并求其平均值: 

DaverageValue=Σi=0MΣj=0N|I(i,j)-averageValue|M×N

利用局部特征去除背景。用3×3大小的滑动窗口,遍历图像,求取中心像素灰度值与周边像素灰度值之差,在每一个窗口图像内求取平均值: 

Average=Σi=07|gi-gc|8

根据实验数据,拟合计算自适应阈值方法: 

ϵ=3.82×DaverageValue+Areaverage.

步骤二:根据印刷字符的密度和经验提取非人民币印刷文字所在的区域,经过步骤1得到LBP编码后的图像,LBP编码后的图像在有字符区域,像素的灰度值比较高,非文字区域像素的灰度值比较低,但仍然存在少量的背景噪声,为了去掉这些非文字区域的噪声,采用一个矩形滑动窗口将非背景噪声去除掉;根据印刷字体具有水平排版和垂直排版性,采用矩形窗口向右生长和向下生长的方法定位出文字所在的区域;印刷在纸币上在的文字大小为最小值为12×12,因此这里采用的矩形窗口大小为12×12即初始值H=12,W=12; 

具体处理步骤如下: 

(A)依照averageGrayValue=Σi=0HΣj=0WLBP(xi,yi)寻找文字所在的区域的开始位置 

这里LBP(xi,yi)指窗口所覆盖区域像素的LBP编码值; 

(B)判断该窗口覆盖区域是否为文字区域 

根据实验数据averageGrayValue>134则表示该区域为文字区域; 

(C)如果找到了文字区域,为了确定文字区域的大小,需要对窗口放大;令H=H+1,W=W+1,重复步骤(A),(B),直到不满足步骤(B)中的 条件为止,表示找到一个文字区域,并令H,W恢复初始值,保存文字区域大小Zone=Zone+(H-1)*(W-1),这里Zone的初始值为0; 

(D)将窗口移至未遍历区域,重复步骤(A)、(B)、(C)直至滑动窗口遍历整幅人民币图像; 

(E)因为人民币本身印刷有“中国人民银行”,“冠字号”等字样,进行判断此币是否印刷有其它文字,且为了保证稳定性,本发明对具有字迹污损的人民币判断如下: 

Zone≤500则为正常纸币,否则为字迹污损币。 

为了能更清晰地理解本发明,以下结合附图和具体实验例对本发明进行详细说明。 

实施例1 

步骤1: 

(1)取10元字迹污损币1张送入多光谱点验钞机; 

(2)点验钞机通过图像高速扫描装置,获取纸币的正面、反面两幅图像,这两幅图像的大小均为300×600;图像中像素的灰度等级为0-255,为了能够对两幅图像进行同时处理,将正反两面图像合成一幅图像,合成后的图像大小为600×600即: 

A、B分别示纸币正反两幅图,M1,N1分别代表正反两幅图像矩阵的行数 和列数,M,N分别代表合并后像矩阵的行数和列数; 

将(2)获得的图像进行LBP编码,采用的LBP算子是一个3×3的矩阵元,LBP编码的计算方式如下: 

LBP(xc,yc)=Σi=0K-1s(g)2k

其中s(g)=1|gi-gc|>ϵ0|gi-gc|ϵ

这里(xc,yc)表示LBP算子矩阵元中心点坐标,像素灰度值为gc;i中心点周围的8邻域像素,像素值为gi;N为周围像素个数,这里K=8,K代表中心像素周围8个邻近像素点的序号,这里我们对这个序号的排列的次序为:以中心点为基点向八个邻近像素点画向量,角度与水平中心轴的夹角进行从小到大排列如下所示: 

8     7     6 

1  (xc,yc)  5 

2     3     4 

ε是一个自适应阈值,阈值的自适应可有效去除人民图像的文字背景,其计算方法如下: 

依照areaAverage=Σi=0M-1Σj=0N-1I(i,j)M×N对整幅人民币图像的每个像素值进行求值,再获取平均值: 

利用求得的灰度平均值去掉部分背景,计算人民币灰度图像的每个像素值与平均像素值的差值的绝对值之和,并求其平均值: 

DaverageValue=Σi=0MΣj=0N|I(i,j)-averageValue|M×N

利用局部特征去除背景。用3×3大小的滑动窗口,遍历图像,求取中心像素灰度值与周边像素灰度值之差,在每一个窗口图像内求取平均值: 

Average=Σi=07|gi-gc|8;

根据实验数据,拟合计算自适应阈值方法: 

ϵ=3.82×DaverageValue+Areaverage;

步骤2:根据印刷字符的密度和经验提取非人民币印刷文字所在的区域,经过步骤1得到LBP编码后的图像,LBP编码后的图像在有字符区域,像素的灰度值比较高,非文字区域像素的灰度值比较低,但仍然存在少量的背景噪声,为了去掉这些非文字区域的噪声,采用一个矩形滑动窗口将非背景噪声去除掉;根据印刷字体具有水平排版和垂直排版的特性,采用矩形窗口向右生长和向下生长的方法定位出文字所在的区域;印刷在纸币上在的文字大小为最小值为12×12,因此这里采用的矩形窗口大小为12×12即初始值H=12,W=12; 

(1)寻找文字所在的区域的开始位置 

averageGrayValue=Σi=0HΣj=0WLBP(xi,yi)

这里LBP(xi,yi)指窗口所覆盖区域像素的LBP编码值; 

(2)判断该窗口覆盖区域是否为文字区域 

根据实验数据averageGrayValue>134则表示该区域为文字区域 

(3)如果找到了文字区域,为了确定文字区域的大小,需要对窗口放大;令H=H+1,W=W+1,重复步骤(1),(2),直到不满足步骤(2)中的条件为止,表示找到一个文字区域,并令H,W恢复初始值,保存文字 区域大小Zone=Zone+(H-1)*(W-1),这里Zone的初始值为0; 

(4)将窗口移至未遍历区域重复步骤(1)、(2)、(3)直至滑动窗口遍历整幅人民币图像;最后得到的Zone≤1532; 

(5)因为人民币本身印刷有“中国人民银行”,“100”等字样,先对这些区域的值设置为背景0,再进行判断此币是否印刷有其它文字,且为了保证稳定性,本发明对具有字迹污损的人民币判断如下: 

Zone>500为字迹污损币。 

本发明一种基于纹理特征识别具有字迹污损人民币的方法主要用于多光谱点钞机、清分机、ATM机中图像处理模块对印刷有其它文字的污损纸币的识别,特别是具有其它印刷字体的人民币,利用LBP算子对人币进行编码,去除人民币图像背景,利用窗口滑动和窗口生长的方法定位文字区域,并最终利用文字区域的大小决定纸币是否属于印刷有其它文字的污损纸币;该方法计算量小,可快速识别印有字迹污损的人民币。 

经广泛查阅国内外公开出版物和专利文献,均未见有与本发明方法完全相同技术方案的报道。本发明在世界上首次利用纸币纹理特征识别污损人民币,具有创造性和新颖性;本发明方法可应用于世界各地的银行、商场的点钞机、清分机、存取款机中,具有广泛的实用性。 

上述实施例仅为本发明的优选例,并不代表本发明的全部应用。本发明方法,还可对人民币100元、50元、20元、5元字迹污损的人民币进行识别,通过纹理特征提取和矩形窗口滑动及生长确定文字区域,判定文字区域进行识别。凡在本发明的精神和原则之内,所做的各种变化、修改,均在本发明的保护范围之内。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号