法律状态公告日
法律状态信息
法律状态
2015-08-05
未缴年费专利权终止 IPC(主分类):G06T7/00 授权公告日:20111214 终止日期:20140607 申请日:20100607
专利权的终止
2011-12-14
授权
授权
2010-12-22
实质审查的生效 IPC(主分类):G06T7/00 申请日:20100607
实质审查的生效
2010-11-10
公开
公开
技术领域
本发明涉及计算机视觉中的图像特征自动检测领域,特别是数字图像中多边形检测方法。
背景技术
多边形检测在计算机视觉和模式识别系统中具有重要应用,如对于建筑物等主要由线条构成的人工场景,多边形检测往往是进行识别分析等任务的必要步骤。目前已有的多边形检测算法主要针对某种具体类型进行检测:Aarts等人先检测目标的边界,然后建立一个回归函数并进而建立一个模型,若该模型满足三角形的条件,则所检测目标就是三角形。Ge等提出了一种利用对称性检测目标的方法,结合要检测目标的边的个数及边的角度,利用对称性定位目标的中心点实现目标的检测。Eberhart等提出了一种利用区域填充及三角形三边的长度与面积之间的关系实现三角形检测的方法。对于四边形的检测,目前的检测算法较多的关注于规则四边形,如矩形的检测。现有的矩形检测技术大多数基于边缘和直线检测,李强兵等通过对图像Hough变换空间中峰值点进行提取和组合,检测出满足角度和长度条件的直线组合,实现了图像中矩形的快速定位。
一方面,目前现有的各种多边形检测算法仍是针对某种具体的多边形(如三角形、矩形等)进行检测,很少有算法可用于各种多边形的同时检测;另一方面,在许多图像识别分析等任务中,无法提前获知多边形的类型。因此,有必要提供一种通用的多边形检测方法。
发明内容
本发明针对现有技术中存在的问题提供一种数字图像中基于基元表示的多边形检测方法,该方法首先检测出图像中的特征点,然后构造由特征点确定的1维基元,接着由1维基元开始不断地组合获得更高维基元或者多边形,直至无法组合获得更高维基元为止。该方法能够同时检测出图像中的各种多边形,而不局限于特定的多边形。
为了实现本目的,本发明提供的一种数字图像中基于基元表示的多边形检测方法,包括以下步骤:
S1:采集图像并输入计算机;
S2:计算图像中各点的方向描述子;
S3:利用步骤S2所述的方向描述子计算图像中各点的绝对角点能量与相对角点能量,检测出图像中的特征点;
S4:对于步骤S3所述的特征点,确定其方向描述子中能量极大值所在的方向,获得由该点确定的1维基元;
S5:对步骤S4所述的任意两个1维基元,进行验证组合,如满足组合为2维基元的条件则组合为一个2维基元;
S6:对步骤S5所述的任意一个2维基元和步骤S4所述的任意一个1维基元,进行验证组合,如满足组合为三角形的条件则组合为三角形并输出,如满足组合为3维基元的条件则组合为3维基元;
S7:对步骤S6所述的任意一个3维基元和步骤S4所述的任意一个1维基元,进行验证组合,如满足组合为四边形的条件则组合为四边形并输出,如满足组合为4维基元的条件则组合为4维基元;
S8:对采用同步骤S5、S6、S7相同处理获得的一个n维基元和步骤S4所述的任意一个1维基元,进行验证组合,如满足组合为多边形的条件则组合为n+1边形并输出,如满足组合为更高维基元的条件则组合为n+1维基元;
S9:重复步骤S8直至无法获得更高维基元为止。
本发明提供的数字图像中基于基元表示的多边形检测方法,首先检测出图像中的特征点,然后构造由特征点确定的1维基元,接着由1维基元开始不断地组合获得更高维基元或者多边形,直至无法组合获得更高维基元为止,从而实现图像中各种多边形的检测。与仅局限于检测特定多边形的现有方法相比,本发明提供的方法可同时检测出各种多边形,具有更加广的适用性。
附图说明
图1所示为本发明数字图像中基于基元表示的多边形检测方法的流程图。
图2所示为本发明步骤S6中一个2维基元和一个1维基元组合为三角形的示意图。
图3所示为本发明步骤S6中一个2维基元和一个1维基元组合为3维基元第一种形式的示意图。
图4所示为本发明步骤S6中一个2维基元和一个1维基元组合为3维基元第二种形式的示意图。
具体实施方式
如图1所示为本发明数字图像中基于基元表示的多边形检测方法的流程图,包括:采集图像并输入计算机;计算图像中各点的方向描述子;利用方向描述子检测出图像中的特征点;获得由特征点确定的1维基元;将两个1维基元进行验证组合,获得2维基元;将获得的2维基元和1维基元进行验证组合,获得三角形或3维基元;将获得的3维基元和1维基元进行验证组合,获得四边形或4维基元;将采用同前一步骤相同处理获得的n维基元和1维基元进行验证组合,获得n+1边形或n+1维基元;重复前一步骤直至无法获得更高维基元为止。
各步骤的具体实施细节如下:
步骤S1:采集图像并输入计算机。利用数码相机拍摄某一场景的图像,输入计算机。
步骤S2:计算图像中各点的方向描述子。步骤S2包括:
S21:对于图像点P,确定以点P为中心,R为半径的一个圆形区域为点P的支撑区域;
S22:对于步骤S21所述支撑区域内的任意点X,计算经过点X且与点X梯度方向垂直的直线l(X),并将沿l(X)且远离点P的方向确定为点X的方向(该方向为[0,359]区间的一个整数);
S23:给点X分配权重其中d1表示
点P到直线l(X)的距离,d2表示点P到点X的距离,mag(X)表示点X的梯度幅值,Ts一般取1~1.5,σ1一般取0.5Ts~0.8Ts,σ2一般取0.5R~0.8R;
S24:构造方向描述子H(P)=[h0,h1,...,h359],其中hn(n=0,1,...,359)为点P支撑区域内方向等于n的点的权重求和,称为点P在方向n上的能量。
步骤S3:利用方向描述子检测出图像中的特征点。对于图像点P,其方向描述子为H(P)=[h0,h1,...,h359],计算点P的总能量与主能量其中θM为能量最大值所在的方向,为与θM相差180的方向且Δ一般取5;计算点P的绝对角点能量EA=ET-EM与相对角点能量如满足以下条件,则将点P确定为一个特征点:(1)点P的绝对角点能量大于阈值TA(TA一般取图像平均绝对角点能量的1.5~2倍),(2)点P的相对角点能量大于阈值TR(TR一般取图像平均相对角点能量的1.5~2倍),(3)点P的绝对角点能量大于其邻域(一般取5×5邻域)内其它点的绝对角点能量。
步骤S4:获得由特征点确定的1维基元。对于步骤S3所述的特征点P,θ1,θ2,...,θs是其方向描述子H(P)=[h0,h1,...,h359]中能量极大值所在的方向,则定义M1(P)=(P,θ1,θ2,...,θs)为点P确定的1维基元。
步骤S5:将两个1维基元进行验证组合,获得2维基元。记步骤S4所述的两个1维基元M1(P1)=(P1,θ11,...,θ1s)、M1(P2)=(P2,θ21,...,θ2t),如果θ11,...,θ1s中存在一个方向θ1k,θ21,...,θ2t中存在一个方向θ2k′,考虑以下条件:(1)θ1k和θ2k′表示的方向相反,且θ1k和矢量的方向一致,(2)N>T·Length,其中N为利用Canny算子对图像进行二值化后二值图像中距离线段P1P2的距离小于1.5的非零点的个数,Length为线段P1P2的长度,T的取值一般为0.85~0.95;如果M1(P1)、M1(P2)同时满足上述两个条件,则1维基元M1(P1)、M1(P2)可组合为2维基元,记作其中表示1维基元M1(P1)中去除方向θ1k获得的1维基元;表示1维基元M1(P2)中去除方向θ2k′获得的1维基元。
步骤S6:将获得的2维基元和1维基元进行验证组合,获得三角形或3维基元。对步骤S5所述的任意一个2维基元和步骤S4所述的任意一个1维基元M1(P),如图2所示,如果M1(P)、M1(P1)与M1(P2)、M1(P)可同时组合为2维基元,则将由点P、P1、P2确定的三角形作为检测结果输出,图中加粗的方向为组合后去除的方向;如图3所示,如果仅M1(P)、M1(P1)可组合为2维基元则可获得3维基元的第一种形式如图4所示,如果仅M1(P2)、M1(P)可组合为2维基元则可获得3维基元的第二种形式
步骤S7:将获得的3维基元和1维基元进行验证组合,获得四边形或4维基元。对步骤S6所述的任意一个3维基元和步骤S4所述的任意一个1维基元M1(P),如果M1(P)、M1(P1)与M1(P3)、M1(P)可同时组合为2维基元,则将由点P、P1、P2、P3确定的四边形作为检测结果输出;如果仅M1(P)、M1(P1)可组合为2维基元则可获得一个4维基元如果仅M1(P3)、M1(P)可组合为2维基元则可获得一个4维基元
步骤S8:将采用同前一步骤相同处理获得的n维基元和1维基元进行验证组合,获得n+1边形或n+1维基元。对采用同步骤S5、S6、S7相同处理获得的一个n维基元和步骤S4所述的任意一个1维基元M1(P),如果M1(P)、M1(P1)与M1(Pn)、M1(P)可同时组合为2维基元,则将由点P、P1、P2、...、Pn确定的n+1边形作为检测结果输出;如果仅M1(P)、M1(P1)可组合为2维基元则可获得一个n+1维基元如果仅M1(Pn)、M1(P)可组合为2维基元则可获得一个n+1维基元
步骤S9:重复步骤S8直至无法获得更高维基元为止。
本发明提供的数字图像中基于基元表示的多边形检测方法,首先检测出图像中的特征点,然后构造由特征点确定的1维基元,接着由1维基元开始不断地组合获得更高维基元或者多边形,直至无法组合获得更高维基元为止,从而实现图像中各种多边形的检测。与仅局限于检测特定多边形的现有方法相比,本发明提供的方法可同时检测出各种多边形,具有更加广的适用性。
机译: 压缩数字图像的方法,涉及量化表示数字图像的图像部分的数据,以及对基于检测到的模式获取的表示数字图像的图像部分的熵编码数据
机译: 在半自动的基于手支撑的基于成像的条形码符号读取器中处理对象的捕获的数字图像的方法和装置,以读取其中图形表示的1D和/或2D条形码符号
机译: 在基于三维体素的系统中将多边形对象的连续三维几何表示转换为离散的基于三维体素的表示的方法