首页> 中国专利> 一种CDR文件自动处理和自动比对方法及系统

一种CDR文件自动处理和自动比对方法及系统

摘要

本发明提供了一种CDR文件自动处理和自动比对方法及系统。本发明所述CDR文件自动处理和自动比对方法及系统执行并发多进程的转换和比对,快速将CDR文件自动转换为PDF文件;并且自动比对CDR文件和PDF文件的版面一致性,发现是否存在版面元素丢失或元素状态改变。在自动比对过程中,执行版面对象及其属性状态的提取,将所提取的版面对象与CDR文件和PDF文件中的版面元素实现匹配识别,根据版面对象与版面元素的匹配结果,实行不同像素单位下的扫描比对,判断版面对象的差异度。

著录项

  • 公开/公告号CN107085505A

    专利类型发明专利

  • 公开/公告日2017-08-22

    原文格式PDF

  • 申请/专利权人 武汉印链科技有限公司;

    申请/专利号CN201710268746.4

  • 发明设计人 李璟;江帆;胡振;罗毅;

    申请日2017-04-21

  • 分类号G06F3/12(20060101);G06F17/21(20060101);

  • 代理机构11384 北京青松知识产权代理事务所(特殊普通合伙);

  • 代理人郑青松

  • 地址 430014 湖北省武汉市东湖新技术开发区关山大道465号曙光广场一期培训楼第三层312-B02号

  • 入库时间 2023-06-19 03:05:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-01

    未缴年费专利权终止 IPC(主分类):G06F 3/12 专利号:ZL2017102687464 申请日:20170421 授权公告日:20200114

    专利权的终止

  • 2020-01-14

    授权

    授权

  • 2017-09-15

    实质审查的生效 IPC(主分类):G06F3/12 申请日:20170421

    实质审查的生效

  • 2017-08-22

    公开

    公开

说明书

技术领域

本发明涉及印刷流程当中的文件印前处理技术,具体来说,涉及一种CDR文件自动处理和自动比对方法及系统。

背景技术

CDR文件是利用CorelDRAW软件进行绘图和版面设计之后导出的一种矢量图形文件。一般合版印刷厂从设计方所获得的都是CDR文件,而印刷机设备通常是将PDF文件作为接受的标准格式,因此印刷厂需要通过印前处理将CDR文件转成PDF文件。

CDR文件与PDF文件均是矢量图形文件,即对于设计版面当中的文字、线条、图片、表格、页面边距以及叠层等版面组成部分,均采用版面元素加以定义。在CDR文件和PDF文件之中,记录了描述每个版面元素的类型、位置、形状、大小等方面的参数。例如,对于一个直线,在CDR文件或PDF文件中通过记录该直线的起点坐标、终点坐标、线型、线宽等参数,矢量图形软件可以借助这些参数来再现和显示该版面元素。将CDR文件转换为PDF文件,即是调用文件转换处理逻辑,将按照CDR规则来定义的各个版面元素转为采用PDF规则对其参数加以定义。但是,由于CDR规则与PDF规则二者是不完全兼容的,因此在规则转换的过程中就容易发生错误;越是复杂的版面设计文件,其中包含的版面元素及其参数就越多,数据结构就越复杂,也就越容易发生错误。CDR到PDF转换过程中,绝大部分错误的类型都是版面元素丢失和版面元素状态改变。版面元素丢失是在CDR文件中定义的某个版面元素,转换之后在PDF文件中没有产生与之对应的版面元素,描述该版面元素的参数被没有记录在PDF文件之中;例如,CDR规则下所支持定义的某些版面元素在PDF规则下不存在,就会出现版面元素丢失的状况。版面元素状态改变,是CDR文件中定义的版面元素在PDF文件中生成了对应的版面元素,但是这两个版面元素的描述参数发生了改变,或则是同一个描述参数在PDF规则下产生了不同于CDR规则的显示效果,这是由于CDR规则和PDF规则对描述参数的定义方式是不同的。从直观上看,就是转换后基于PDF文件所绘制出来的版面与基于CDR文件绘制的源版面有在视觉效果上的差异度。

由CDR文件转到PDF文件都是通过人工的方式进行处理的。因为CDR文件转成PDF文件过程中,会出现版面元素丢失或效果变化的情况,所以,印前人员转换完一个CDR文件之后,紧接着还要人工对比原来的CDR文件和转换出来的PDF文件在版面和效果上是否一致。比如,每天处理5000个印刷任务的大型合版印刷厂,会有十二个左右的印前人员负责转换CDR文件以及进行CDR与PDF文件比对,即每人每天处理和比对400多个任务。显而易见,依靠人工完成该项工作非常耗时,且极易出错。

目前,绝大部分印刷厂所普遍采用的仍然是上述人工比对的方式。不过,经检索发现,也有少量的现有技术运用自动比对的方式,将原CDR文件与转换后的PDF文件二者均由矢量化的图形文件转制为像素点阵图像,然后从两个像素点阵图像当中每次提取出一个像素单位,例如一个像素块、或是一行或一列像素,亦或一个单独像素,来进行差异度的比对。

例如,公布号为CN204977801A的发明专利公开了一种印前对版系统,其中,将设计PDF文件与拼版PDF文件转换为BMP图像,在比较二者的BMP图像存在的差异。

例如,公布号为CN103336759A的发明专利申请公开了一种印前图文自动校对装置,包括:源文件读取模块、印刷文件读取模块、格式识别模块、存储模块、格式转换模块、校对模块以及标示模块;其中,将包括CDR格式在内的源文件和包括PDF格式在内的印刷文件通过格式转换矩阵转换为校对格式;校对模块采用线扫描、块扫描、像素扫描中的一种或多种扫描方式对校对格式的文件进行校对,在校对结果中将与客户源文件不匹配的位置(包括文字、图案、网点深浅)标示出来。

现有技术中在像素点阵图像的基础上在像素单位之间进行相互比对,所存在的缺点在于以下方面:

一是计算量大,比对结果出来得慢。而且每次比对计算所提取像素单位越小,则比对结果越难以被快速计算出来。如果采用最精细的逐像素比对,则显示最终比对结果之前就会存在一段非常长的等待时间,这往往不符合实际工作效率上的要求。

二是误报错率高,即在源文件与转换后的文件版面一致的情况下也进行报错。经过总结实际经验,发现越是采用精细的像素单位,则越容易出现误报错的情形。并且,在两种情况下,误报错的发生较为频繁:一种情况是源文件的像素点阵图像与转换后文件的像素点阵图像,二者存在基准偏差;形象的说就是两个版面之间没有对齐,如图1所示,如果我们单纯以两个版面顶点相互对齐而作为基准,由于转换上的误差,可能使得版面所有元素之间都存在一个细小的偏移量,这样采用线扫描或者像素扫描就会发生大面积的误报错问题。另一种情况则是在将源文件和转换后文件分别生成像素点阵图像过程中,因正常的误差效应而产生了对版面视觉效果无任何实质性影响的细微区别,例如1-3个像素级的位置偏移或线长变化,像素亮度值发生1到3个数值上的偏离,但该细微区别也被计入了比对差异度,在像素扫描的情况下这一问题尤为常见。如果我们采用精细度相对较差的像素块扫描,则上述误报错率高的问题能够得到缓解,但漏报的机率会明显上升。

可见,现有技术中,不论是比较常见的人工比对,还是相对较少采用的自动比对,都存在一定的缺陷,在可靠性和工作效率方面都存在需要改进之处。

发明内容

为了克服现有技术中的上述缺陷,本发明提供了一种CDR文件自动处理和自动比对方法及系统。本发明所述CDR文件自动处理和自动比对方法及系统执行并发多进程的转换和比对,快速将CDR文件自动转换为PDF文件;并且自动比对CDR文件和PDF文件的版面一致性,发现是否存在版面元素丢失或元素状态改变。

在自动比对方面,鉴于现有技术在像素点阵图像的基础上直接计算像素单位之间差异度所存在的不足,本发明采用了如下技术手段:将CDR文件与PDF文件二者的像素点阵图像(下称由CDR文件生成的像素点阵图像为CDR像素点阵图像,由PDF文件生成的像素点阵图像为PDF像素点阵图像)首先执行版面对象及其属性状态的提取;进而,将所提取的版面对象与CDR文件和PDF文件中的版面元素实现匹配识别;然后针对CDR像素点阵图像与PDF像素点阵图像进行基准对齐处理;基于CDR文件转PDF文件过程中的元素关系映射表,以及版面对象与版面元素的匹配结果,进行CDR像素点阵图像与PDF像素点阵图像之间版面对象的相互比较计算,其中,在CDR像素点阵图像与PDF像素点阵图像不同的版面区域,实行不同像素单位下的扫描比对,判断版面对象的差异度,从而有效发现版面元素丢失或元素状态改变。

一种CDR文件自动处理和自动比对方法,其特征在于,包括以下步骤:

步骤1,并发多个转换进程,每个转换进程调用各自专用的文件转换处理逻辑,执行CDR文件到PDF文件的自动转换,并且为每个转化任务建立元素关系映射表;

步骤2,为作为源文件的CDR文件和转换后的PDF文件二者,分别生成像素点阵图像,即CDR像素点阵图像和PDF像素点阵图像;

步骤3,针对CDR像素点阵图像以及PDF像素点阵图像,执行版面对象及其属性状态的提取;

步骤4,将从CDR像素点阵图像以及PDF像素点阵图像当中所提取的各个版面对象,分别与CDR文件和PDF文件中的版面元素实现基于位置匹配的识别;

步骤5,针对CDR像素点阵图像与PDF像素点阵图像,根据其中版面对象与版面元素的匹配,以及元素关系映射表中记录的CDR文件与PDF文件的版面元素的对应关系,确定CDR像素点阵图像和PDF像素点阵图像当中相互对应的版面对象;参照相互对应的这些版面对象的位置参数和尺寸参数,对PDF像素点阵图像当中的像素坐标统一施加固定的修正值,实现CDR像素点阵图像与PDF像素点阵图像的基准对齐处理;

步骤6,基于CDR文件转PDF文件过程中的元素关系映射表,以及版面对象与版面元素的匹配结果,在基准对齐之后的CDR像素点阵图像与PDF像素点阵图像不同的版面图像区域,实行不同像素单位下的扫描比对,判断版面对象的差异度;对于版面图像区域的差异度超过一定阈值的情况,在CDR像素点阵图像与PDF像素点阵图像中该图像区域处均标示出报错提示框。

优选的是,步骤3中对版面对象及其属性状态的提取具体包括:针对CDR像素点阵图像以及PDF像素点阵图像,先后进行执行灰度化、体现像素块均一度的二值标记,基于分布统计确定高灰度阈值和低灰度阈值,基于灰度的二值标记处理,在基于灰度的二值标记处理基础上,通过像素连通性与邻近性执行版面对象的提取。

优选的是,步骤3中,对于提取出来的版面对象,进而提取每一个版面对象的位置参数、尺寸参数;位置参数与尺寸参数可以求取每个版面对象的外接矩形,以该外接矩形的左上角顶点坐标表示其位置参数,以该外接矩形左上、右下顶点坐标的数组表示其尺寸参数。

优选的是,步骤4具体包括:解析CDR文件或PDF文件中定义的各版面元素的参数,从中获得版面元素的位置参数与尺寸参数;进行参数格式的调整,将按照CDR或PDF规则所定义的版面元素的位置参数与尺寸参数,转换为根据该版面元素外接矩形左上角顶点坐标表示的位置参数,以及以该外接矩形左上、右下顶点坐标的数组表示的尺寸参数;对于CDR文件或PDF文件中定义的版面元素,以及步骤3所提取的版面对象,利用二者的位置参数与尺寸参数,进行位置偏离量和尺寸偏离量的计算;判断位置偏离量、尺寸偏离量是否小于预定的偏离标准;如果在位置偏离量和尺寸偏离量方面都小于预定偏离标准,则认为所提取的版面对象与CDR或PDF文件中的版面元素相匹配。

优选的是,步骤3中,为CDR像素点阵图像以及PDF像素点阵图像各建立一个版面对象登记表,保存所提取的版面对象的标识符,并且对应存储位置参数、尺寸参数;而且,在步骤4中,在版面对象登记表当中记录与版面对象相匹配的版面元素的元素标识符。

优选的是,步骤5中,以CDR像素点阵图像的像素坐标为基准,将PDF像素点阵图像当中的像素坐标统一施加固定的修正值,也即将PDF像素点阵图像进行上、下、左、右方向的平移,使修正之后CDR像素点阵图像与PDF像素点阵图像当中相互对应的版面对象尽可能多的对齐。

优选的是,步骤6中,如果CDR文件中具有一版面元素,但在元素关系映射表中未登记与该版面元素相对应的PDF文件版面元素,则获得在CDR像素点阵图像当中与该CDR版面元素相匹配的版面对象;根据该版面对象的位置参数与尺寸参数,确定在基准对齐之后的PDF像素点阵图像当中与该版面对象所在位置和尺寸相同的图像区域;针对CDR像素点阵图像与PDF像素点阵图像二者当中该版面对象所在的图像区域,以较小的像素单位扫描。

优选的是,步骤6中,如果CDR文件中具有一版面元素,且在元素关系映射表中登记了与该版面元素相对应的PDF文件版面元素;分别获得在CDR像素点阵图像和PDF像素点阵图像当中与版面元素相匹配的版面对象;根据这两个版面对象的位置参数与尺寸参数,确定在基准对齐之后的两个版面对象所在图像区域的位置和尺寸是否一致;若一致,则针对CDR像素点阵图像与PDF像素点阵图像二者当中这两个版面对象所在的图像区域,以较大的像素单位扫描;当二者差异度超过一定阈值时,则转为以较小的像素单位再次扫描;若两个版面对象所在图像区域的位置和尺寸不一致,则以较小的像素单位执行扫描。

优选的是,步骤6中,如果PDF文件中具有一版面元素,但在元素关系映射表中未查到有与该版面元素相对应的CDR文件版面元素;则获得在PDF像素点阵图像当中与该PDF版面元素相匹配的版面对象;根据该版面对象的位置参数与尺寸参数,确定在基准对齐之后的CDR像素点阵图像当中与该版面对象所在位置和尺寸相同的图像区域;针对PDF像素点阵图像与CDR像素点阵图像二者当中该版面对象所在的图像区域,以较小的像素单位扫描。

一种CDR文件自动处理和自动比对系统,其特征在于,包括:

CDR文件转换处理模块,用于并发建立多个转换进程,每个转换进程调用各自专用的文件转换处理逻辑,将CDR文件转换为PDF文件;并且,由转换进程负责为每个由CDR文件到PDF文件的转换任务建立一个元素关系映射表;该表中记录CDR文件中所有版面元素的元素标识符;并且为由CDR文件到PDF文件转换成功的版面元素记录下该版面元素在PDF文件中的元素标识符,保存该版面元素的以上两个标识符的关联关系;

像素点阵图像生成模块,为作为源文件的CDR文件和转换后的PDF文件二者,分别生成CDR像素点阵图像和PDF像素点阵图像;

版面对象提取模块,针对CDR像素点阵图像以及PDF像素点阵图像,先后进行执行灰度化、体现像素块均一度的二值标记,基于分布统计确定高灰度阈值和低灰度阈值,基于灰度的二值标记处理,在基于灰度的二值标记处理基础上,通过像素连通性与邻近性执行版面对象及其属性状态的提取;为CDR像素点阵图像以及PDF像素点阵图像各建立一个版面对象登记表,记录所提取的版面对象及其位置参数、尺寸参数;

版面对象匹配识别模块,将从CDR像素点阵图像以及PDF像素点阵图像当中所提取的各个版面对象,分别与CDR文件和PDF文件中的版面元素实现基于位置匹配的识别,确定版面对象相匹配的版面元素;

基准对齐模块,根据版面对象与版面元素的匹配关系,以及元素关系映射表中记录的CDR文件与PDF文件的版面元素的对应关系,确定CDR像素点阵图像和PDF像素点阵图像当中相互对应的版面对象;参照相互对应的这些版面对象的位置参数和尺寸参数,对PDF像素点阵图像当中的像素坐标统一施加固定的修正值,实现CDR像素点阵图像与PDF像素点阵图像的基准对齐处理;

扫描比对与报错模块,基于CDR文件转PDF文件过程中的元素关系映射表,以及版面对象与版面元素的匹配结果,在基准对齐之后的CDR像素点阵图像与PDF像素点阵图像不同的版面图像区域,实行不同像素单位下的扫描比对,判断版面对象的差异度;对于版面图像区域的差异度超过一定阈值的情况,在CDR像素点阵图像与PDF像素点阵图像中该图像区域处均标示出报错提示框。

本发明相对于现有技术中小像素单位甚至是逐像素的比对方法,采用了能够自适应配置的多等级像素单位,优化了运算效率,整体上降低了比对运算量,增加了计算的并行性,降低了做出比对结果的时间延迟;避免了由于基准偏差等因素带来的误报错现象,提高了比对可靠性。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明:

图1是现有技术中像素点阵图像基准偏差的示意图;

图2是本发明所述CDR文件自动处理和自动比对方法流程示意图;

图3是本发明所述版面对象及其属性状态提取具体子步骤的示意图;

图4A-B是本发明对被标记为1的像素的像素灰度值分布统计示意图;

图5是本发明所述CDR文件自动处理和自动比对系统的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合实施例及实施例附图对本发明作进一步详细的说明。

本发明提供了一种CDR文件自动处理和自动比对方法。本发明作为合版印刷厂的印前处理工序,对于由印刷版面设计方(如版面设计工作室、个人设计师等)提供的CDR文件,执行并发多进程的转换和比对,快速将CDR文件自动转换为PDF文件;并且自动比对CDR文件和PDF文件的版面一致性,发现是否存在版面元素丢失或元素状态改变。经比对无报错提示,则将所转换的PDF文件传输给印刷机,投入印刷工序;经比对发现版面不一致,则在不一致的版面区域处显示出报错提示框,以便由校版人员对PDF文件进行人工复核与修正。

图2是本发明所述CDR文件自动处理和自动比对方法流程示意图。下面对本方法的各步骤予以详细描述。

步骤1,并发多个转换进程,执行CDR文件到PDF文件的自动转换。

CDR文件转换处理的核心是调用CorelDRAW软件提供的vgcoreauto自动化com接口组件,通过该接口组件的调用,可以操作CorelDRAW去执行文件转换处理逻辑,把CDR文件变成PDF文件,即是调用该文件转换处理逻辑将按照CDR规则来定义的各个版面元素转为采用PDF规则对其参数加以定义。

为了提高转换效率,本发明打开多个并行的转换进程,每个转换进程调用各自专用的文件转换处理逻辑;对于一个新分配的CDR文件,将其推送给当前空闲的转换进程予以处理。通过并发多进程的处理,提高了每小时转换文件的效率。

并且,在本步骤中,转换进程负责为每个由CDR文件到PDF文件的转换任务建立一个元素关系映射表。在该元素关系映射表中,首先通过解析CDR文件,记录下CDR文件中所有版面元素的元素标识符(下称CDR元素标识符)。对于每个由CDR文件到PDF文件转换成功的版面元素,在该映射表中再记录下该版面元素在PDF文件中的元素标识符(下称PDF元素标识符),并且保存该版面元素的以上两个标识符的关联关系(例如,通过二维数组来登记)。因为在转换过程中,版面元素的标识符在PDF规则下其命名格式也可能会发生改变,因而该元素关系映射表的建立,更有助于快速查找和判定CDR文件和PDF文件之间版面元素的对应关系。

步骤2,为作为源文件的CDR文件和转换后的PDF文件二者,分别生成像素点阵图像,即CDR像素点阵图像和PDF像素点阵图像。

对于CDR文件和PDF文件,可分别利用CorelDRAW和Adobe acrobat等支持CDR和PDF规则的软件所提供的功能,解析作为源文件的CDR文件和转换后的PDF文件,从而根据解析获得的参数,在各个图层区绘制文件中全部版面元素,为CDR文件和PDF文件分别绘制版面的矢量图像;进而,对CDR文件和PDF文件所绘制的版面图像分别提取其在各点的像素值,从而生成像素点阵图像,即CDR像素点阵图像和PDF像素点阵图像,其中像素值统一采用RGB标准来表示。CDR像素点阵图像和PDF像素点阵图像分别代表CDR文件和PDF文件实际生成的版面画面,因而将CDR像素点阵图像和PDF像素点阵图像作为判断CDR文件和PDF文件二者版面画面一致性的比对标的。

步骤3,针对CDR像素点阵图像以及PDF像素点阵图像,执行版面对象及其属性状态的提取。图3示出了该版面对象及其属性状态提取步骤的具体子步骤。

首先,步骤301当中,对CDR像素点阵图像以及PDF像素点阵图像,分别进行灰度化处理,为CDR像素点阵图像以及PDF像素点阵图像分别生成灰度像素点阵图像副本,下称为CDR灰度图像和PDF灰度图像。对于CDR像素点阵图像以及PDF像素点阵图像中的每一个像素点,按照以下公式将其采用RGB色彩标准的像素值转换为CDR灰度图像或者PDF灰度图像当中的像素灰度值:

Gray=R·0.299+G·0.587+B·0.114

其中Gray为CDR灰度图像或者PDF灰度图像当中的像素灰度值;R,G,B为CDR像素点阵图像或PDF像素点阵图像中的每一个像素点的颜色分量值。

步骤302,对CDR灰度图像和PDF灰度图像分别进行体现像素块均一度的二值标记。在步骤302中,统计CDR灰度图像或PDF灰度图像划分为4*4、6*6或8*8的像素块;对于每个像素块,计算该块中像素灰度值的均值,作为该像素块的代表值M;进而,对于该像素块当中的每一个像素,将该像素的像素灰度值Gray与该像素块的代表值M进行比较;若该像素块中灰度值Gray与该代表值M的差值未超出预定范围的像素数量大于等于一预定阈值,则将该像素块中全体像素标记为1;若该像素块中像素灰度值Gray与该代表值M的差值未超出预定范围的像素数量小于该预定阈值,则将该像素块中全体像素的像素值标记为0;上述计算遍历完CDR灰度图像或PDF灰度图像的全部像素块,从而为CDR灰度图像或PDF灰度图像的每个像素值进行了0或1的二值标记。

步骤303中,取得CDR灰度图像和PDF灰度图像当中在步骤302被标记为1的像素,进行像素灰度值Gray的分布统计,并基于分布统计确定高、低灰度阈值。判断被标记为1的像素的像素灰度值Gray的分布是单峰分布还是多峰分布,单峰分布如图4A所示,多峰分布为图4B所示。对于单峰分布的情况,如图4A所示,设定高灰度阈值ThH和低灰度阈值ThL,使得分布于以上两阈值之间的被标记为1的像素数量占全部被标记为1的像素数量的80%以上。对于多峰分布的情况,则进一步对被标记为1的像素进行位置过滤提取;在位置过滤提取当中,针对步骤302中全体像素标记为1的像素块,提取像素块位于CDR灰度图像或PDF灰度图像上、下、左、右边缘区域的像素块,针对这些像素块中的像素再次进行像素灰度值Gray的分布统计,并基于分布统计确定高灰度阈值ThH和低灰度阈值ThL,使得上述边缘区域像素块中分布于以上两阈值之间的像素数量占边缘区域像素块全部像素数量的80%以上。

步骤304,利用高灰度阈值ThH和低灰度阈值ThL,对CDR灰度图像和PDF灰度图像再次执行基于灰度的二值标记;将像素灰度值Gray位于高灰度阈值ThH和低灰度阈值ThL之间的像素标记为0,将像素灰度值Gray位于高灰度阈值ThH和低灰度阈值ThL以外的像素标记为1。

步骤305,根据基于灰度的二值标记,判断像素的连通性和邻近性,从而对CDR像素点阵图像以及PDF像素点阵图像执行版面对象及其属性状态的提取。对于通过步骤304被标记为1的每一个像素,在本步骤中,判断该像素相邻的8像素当中是否也具有标记为1的像素;如果存在标记为1的相邻像素,则认为该像素与该相邻像素具备连通性;将具备连通性的像素归为一个子集对象,从而,通过遍历所有步骤304中标记为1的像素,将这些像素划分成若干子集对象,每个子集对象内的像素是连通的,而不同子集对象中的像素彼此是互不连通的。进而,对于两个子集对象,判断二者最小像素间距,即,取子集对象A中的每一个像素,计算与子集对象B中每一个像素之间的像素间距,通过遍历子集对象A与B中每一个像素,所得到的像素间距中的最小值作为二者的最小像素间距。若任意两个子集对象的最小像素间距小于等于间距阈值,则将二者合并为同一个版面对象;对于与其它子集对象的最小像素间距均大于间距阈值的子集对象,则单独构成一个版面对象。从而,基于像素的连通性和邻近性,从CDR像素点阵图像以及PDF像素点阵图像当中提取了版面对象。

对于所提取出来的版面对象,步骤305中进而提取每一个版面对象的属性状态,包括每一个版面对象的位置参数、尺寸参数。位置参数与尺寸参数可以求取每个版面对象的外接矩形,以该外接矩形的左上角顶点坐标表示其位置参数,以该外接矩形左上、右下顶点坐标的数组表示其尺寸参数。

对于被提取的版面对象及其位置参数、尺寸参数;在步骤305中为CDR像素点阵图像以及PDF像素点阵图像各建立一个版面对象登记表,其中为所提出的每一个版面对象保留一个条目,在该条目下定义和存储版面对象的标识符,并且对应存储位置参数、尺寸参数。

可见,步骤3当中,先后执行灰度化、体现像素块均一度的二值标记,基于分布统计确定高灰度阈值和低灰度阈值,基于灰度的二值标记,以及通过像素连通性与邻近性执行版面对象及其属性状态的提取。众所周知,从面向对象的矢量图形转换为像素点阵图像相对容易,而反过来,由像素点阵图像当中提取对象是非常复杂的,所需计算量很大,本不易实现。而本申请步骤3的机理在于应用了版面图像的特殊性质。因为版面图像一般具有白色或其它均一颜色的底色,且在版面图像的上、下、左、右边缘区域主要呈现的是该底色;且为了视觉效果的清楚可辨,版面图像上的有效版面元素的颜色与该底色会具有明显的差别,例如在白色底色上多以黑色或其它深色来印刷文字、线条、色块等,以及印刷彩色图片。另外,文字、线条、色块、彩图等版面元素之间绝大多数情况下也会具有上、下、左、右的间隔,间隔中呈现出来底色。因而,本申请在灰度化之后,执行体现像素块均一度的二值标记,版面图像中呈现出底色的部分具有高像素块均一度,因而被标记为1;相反,文字、线条、彩图等版面元素位置处的像素块具有低均一度,因而不会被标记为1;但是,版面元素中如果存在较大的均一颜色的色块,则也有可能被标记为1。对于被标记为1的像素进行像素灰度值Gray的分布统计;在单峰分布的情形下这些像素可直接认为属于底色像素,在多峰分布的情形下,说明这些像素中的一部分可能是来自较大的均一色块版面元素,因而再面向版面边缘处的被标记为1的像素执行像素灰度值Gray的分布统计,最终基于分布统计确定高、低灰度阈值。以高、低灰度阈值为参照,基于灰度的二值标记步骤中被标记为1的是归属于版面元素本身的像素;对于这些像素通过空间上的连通性和邻近性判断,可以将其归属于不同的版面元素,利用不同版面元素间隔分布的特征,从而提取出版面对象及其属性状态。可见,本申请针对版面图像特点所设计的版面对象提取方法不需要复杂的边缘检测和结构分析运算,主要依靠灰度判断和像素标记实现,能够快速达到从CDR像素点阵图像以及PDF像素点阵图像提取各版面对象的目的。

步骤4,将从CDR像素点阵图像以及PDF像素点阵图像当中所提取的各个版面对象,分别与CDR文件和PDF文件中的版面元素实现基于位置匹配的识别。基于所提取的版面对象的位置参数和尺寸参数,判断其与CDR文件或PDF文件中的版面元素在空间位置上的趋近程度,从而将每个提取的版面对象与CDR文件或PDF文件中的版面元素相匹配。

在本步骤中,解析CDR文件中定义的各版面元素的参数,从中获得版面元素的位置参数与尺寸参数。进行参数格式的调整,即对于按照CDR文件规则所定义的版面元素的位置参数和尺寸参数,换算为采用与步骤305中版面对象的位置参数、尺寸参数相同的定义方式。接下来,对于CDR文件中定义的版面元素,以及通过步骤305所提取的版面对象,利用二者的位置参数与尺寸参数,进行位置偏离量和尺寸偏离量的计算。例如,CDR文件中版面元素E的位置参数坐标为(xE,yE),尺寸参数(xE,yE),(x′E,y′E);所提取的版面对象0的位置参数坐标(xO,yO),尺寸参数(xO,yO),(x′O,y′O);对于E与O分别计算其尺寸计算E与O的位置偏离量(Δx=|xE-xO|,Δy=|yE-yO|),以及E与O的尺寸偏离量|SizeE-SizeO|。根据所获得的位置、尺寸及偏离量,判断位置偏离量、尺寸偏离量是否小于预定的偏离标准;例如,如果Δx≤10%*|xE-x′E|且Δy≤10%*|yE-y′E|,则认为位置偏离量小于预定偏离标准;如果|SizeE-SizeO|≤10%*SizeE,则认为尺寸偏离量小于预定偏离标准。如果所提取的版面对象与CDR文件的版面元素在位置偏离量和尺寸偏离量方面都小于预定偏离标准,则认为该版面对象与CDR中的该版面元素相匹配;这样,在CDR的版面对象登记表当中针对该版面对象记录与之匹配的CDR版面元素的元素标识符。反之,如果所提取的版面对象与CDR文件的版面元素在位置偏离量和尺寸偏离量的任何一个上大于预定偏离标准,则认为二者不匹配。

按照同样的方法,可以将从PDF像素点阵图像当中所提取的各个版面对象,与PDF文件中的版面元素进行位置匹配,并且对于匹配成功的情形,在PDF的版面对象登记表当中记录与版面对象相匹配的PDF版面元素的元素标识符。

步骤5,然后针对CDR像素点阵图像与PDF像素点阵图像进行基准对齐处理。基于CDR的版面对象登记表,可以获得CDR像素点阵图像当中各个版面对象与哪个CDR版面元素相匹配;类似,在PDF的版面对象登记表中,可获得PDF像素点阵图像当中各个版面对象与哪个PDF版面元素相匹配。再进一步结合步骤1所建立的元素关系映射表,其中记录了CDR版面元素与PDF版面元素之间的映射关系;因而,参照以上记录,可以获得CDR像素点阵图像当中部分版面对象在PDF像素点阵图像当中相对应的版面对象;例如,CDR像素点阵图像当中的某版面对象01,其匹配的CDR版面元素为F1,根据元素关系映射表,F1在PDF文件中对应的版面元素为F1’,而PDF像素点阵图像当中的版面对象01’与该版面元素F1’相匹配;则可以将CDR像素点阵图像当中的版面对象01与PDF像素点阵图像当中的版面对象01’相对应;这样,CDR像素点阵图像与PDF像素点阵图像当中的至少一部分版面对象可以相互对应。

基于CDR像素点阵图像与PDF像素点阵图像当中相互对应的这些版面对象的位置参数和尺寸参数,实现CDR像素点阵图像与PDF像素点阵图像的基准对齐处理。即,以CDR像素点阵图像的像素坐标为基准,将PDF像素点阵图像当中的像素坐标统一施加固定的修正值,也即将PDF像素点阵图像进行上、下、左、右方向的平移,使修正之后两像素点阵图像中相互对应的这些版面对象尽可能多的对齐。例如,CDR像素点阵图像当中有版面对象01、02、03,04,在PDF像素点阵图像当中有与01,02,03相对应的版面对象01’、02’、03’,而版面对象04则未查找到在PDF像素点阵图像当中与之对应的版面对象。假设01位置参数坐标(xO1,yO1),01’的位置参数坐标为(xO1+Δ1x,yO1+Δ1y);02位置参数坐标(xO2,yO2),02’的位置参数坐标为(xO2+Δ1x,yO2+Δ1y);03位置参数坐标(xO3,yO3),03’的位置参数坐标为(xO3+Δ2x,yO3+Δ2y);则按照使修正好相互对齐的版面对象尽可能多的原则,对PDF像素点阵图像中的每一个像素坐标施加修正值(Δ1x,Δ1y),从而使得01与01’,02与02’都达到了相互对齐。

步骤6,基于CDR文件转PDF文件过程中的元素关系映射表,以及版面对象与版面元素的匹配结果,进行CDR像素点阵图像与PDF像素点阵图像之间版面对象的相互比较计算,其中,在CDR像素点阵图像与PDF像素点阵图像不同的版面区域,实行不同像素单位下的扫描比对,判断版面对象的差异度,从而有效发现版面元素丢失或元素状态改变。根据之前各步骤的结果,分以下情况执行所述不同像素单位下的扫描比对:

(1)CDR文件中具有一版面元素,但在元素关系映射表中未登记与该版面元素相对应的PDF文件版面元素(有可能是转换失败造成了元素丢失,也有可能是转换后的PDF版面元素因格式不兼容的原因无法与CDR的版面元素实现对应);则根据CDR的版面对象登记表,获得在CDR像素点阵图像当中与该CDR版面元素相匹配的版面对象。根据该版面对象的位置参数与尺寸参数,确定在基准对齐之后的PDF像素点阵图像当中与该版面对象所在位置和尺寸相同的图像区域。针对CDR像素点阵图像与PDF像素点阵图像二者当中该版面对象所在的图像区域,以较小的像素单位扫描(如线扫描、像素扫描或者较小块的像素块扫描),比较这两个区域的一致性。当二者差异度超过一定阈值时,则判断存在版面元素异常,则在CDR像素点阵图像与PDF像素点阵图像中上述图像区域处标示出报错提示框。

(2)CDR文件中具有一版面元素,且在元素关系映射表中登记了与该版面元素相对应的PDF文件版面元素;则根据CDR和PDF的版面对象登记表,分别获得在CDR像素点阵图像和PDF像素点阵图像当中与版面元素相匹配的版面对象。进而,根据这两个版面对象的位置参数与尺寸参数,确定在基准对齐之后的两个版面对象所在图像区域的位置和尺寸是否一致。若一致,则针对CDR像素点阵图像与PDF像素点阵图像二者当中这两个版面对象所在的图像区域,以较大的像素单位扫描(如较大块的像素块扫描),比较这两个区域的一致性。如果二者的差异未超过一定阈值,则认为该版面元素的一致性检测通过;当二者差异度超过一定阈值时,则转为以较小的像素单位再次扫描,判断是否存在版面元素异常;如果存在异常,则在CDR像素点阵图像与PDF像素点阵图像中上述图像区域处标示出报错提示框。另一种情况,如果CDR像素点阵图像和PDF像素点阵图像当中两个版面对象所在图像区域的位置和尺寸不一致,则直接以较小的像素单位(如线扫描、像素扫描或者较小块的像素块扫描)对两个图像区域累加在一起的区域执行扫描,比较这两个区域的一致性。对于存在版面元素异常,则在CDR像素点阵图像与PDF像素点阵图像中上述图像区域处标示出报错提示框。

(3)PDF文件中具有一版面元素,但在元素关系映射表中未查到有与该版面元素相对应的CDR文件版面元素(有可能是由于转换不兼容所造成的差异,造成无法将该版面元素与其在CDR当中的源版面元素实现对应);则根据PDF的版面对象登记表,获得在PDF像素点阵图像当中与该PDF版面元素相匹配的版面对象。根据该版面对象的位置参数与尺寸参数,确定在基准对齐之后的CDR像素点阵图像当中与该版面对象所在位置和尺寸相同的图像区域。针对PDF像素点阵图像与CDR像素点阵图像二者当中该版面对象所在的图像区域,以较小的像素单位扫描(如线扫描、像素扫描或者较小块的像素块扫描),比较这两个区域的一致性。当二者差异度超过一定阈值时,则判断存在版面元素异常,则在CDR像素点阵图像与PDF像素点阵图像中上述图像区域处标示出报错提示框。

本申请通过对不同的区域采用了不同像素单位的像素扫描,因而对于一致性较好的版面元素(事实上这类版面元素在一般的CDR至PDF转换中占大部分),可以以较大尺度的像素单位进行扫描,这不仅提高了计算效率,降低了获得比对结果的延时,也明显降低了误报错率。而且,由于本申请以版面元素为单元依次执行比对,还采用了并发多线程的处理技术,因而,在步骤6中,对于各个版面元素的上述比对是可以交由不同的线程并行处理完成的,从而进一步加快了获得比对结果的时间。

图5示出了本发明所述CDR文件自动处理和自动比对系统的结构示意图。该系统包括:

CDR文件转换处理模块,用于并发建立多个转换进程,每个转换进程调用各自专用的文件转换处理逻辑,将CDR文件转换为PDF文件;并且,由转换进程负责为每个由CDR文件到PDF文件的转换任务建立一个元素关系映射表;该表中记录CDR文件中所有版面元素的元素标识符;并且为由CDR文件到PDF文件转换成功的版面元素记录下该版面元素在PDF文件中的元素标识符,保存该版面元素的以上两个标识符的关联关系。

像素点阵图像生成模块,为作为源文件的CDR文件和转换后的PDF文件二者,分别生成CDR像素点阵图像和PDF像素点阵图像,作为判断CDR文件和PDF文件二者版面画面一致性的比对标的。

版面对象提取模块,针对CDR像素点阵图像以及PDF像素点阵图像,先后进行执行灰度化、体现像素块均一度的二值标记,基于分布统计确定高灰度阈值和低灰度阈值,基于灰度的二值标记处理,在基于灰度的二值标记处理基础上,通过像素连通性与邻近性执行版面对象及其属性状态的提取;为CDR像素点阵图像以及PDF像素点阵图像各建立一个版面对象登记表,记录所提取的版面对象及其位置参数、尺寸参数。

版面对象匹配识别模块,将从CDR像素点阵图像以及PDF像素点阵图像当中所提取的各个版面对象,分别与CDR文件和PDF文件中的版面元素实现基于位置匹配的识别,确定版面对象相匹配的版面元素。

基准对齐模块,根据版面对象与版面元素的匹配关系,以及元素关系映射表中记录的CDR文件与PDF文件的版面元素的对应关系,确定CDR像素点阵图像和PDF像素点阵图像当中相互对应的版面对象;参照相互对应的这些版面对象的位置参数和尺寸参数,对PDF像素点阵图像当中的像素坐标统一施加固定的修正值,实现CDR像素点阵图像与PDF像素点阵图像的基准对齐处理。

扫描比对与报错模块,基于CDR文件转PDF文件过程中的元素关系映射表,以及版面对象与版面元素的匹配结果,在基准对齐之后的CDR像素点阵图像与PDF像素点阵图像不同的版面图像区域,实行不同像素单位下的扫描比对,判断版面对象的差异度;对于版面图像区域的差异度超过一定阈值的情况,在CDR像素点阵图像与PDF像素点阵图像中该图像区域处均标示出报错提示框。

本发明相对于现有技术中小像素单位甚至是逐像素的比对方法,采用了能够自适应配置的多等级像素单位,优化了运算效率,整体上降低了比对运算量,增加了计算的并行性,降低了做出比对结果的时间延迟;避免了由于基准偏差等因素带来的误报错现象,提高了比对可靠性。

以上描述中的尺寸和数量均仅为参考性的,本领域技术人员可根据实际需要选择适当的应用尺寸,而不脱离本发明的范围。本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求所界定的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号