首页> 中国专利> 用于打印文档的简单编码、认证和复制检测的系统

用于打印文档的简单编码、认证和复制检测的系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

描述了一种用于打印文档认证的新编码方法，该方法的一个目的是增加复制难度。此外，在某些约束条件下，这种新编码方法相比于其他2D编码技术提供了更好的表现。该新编码技术相比于其他编码技术需要较少的打印空间。这是通过对在标准2D码中用于稳定化并且对例如移动应用而言所必需的特征中的一些特征进行优化来实现的。此外，代码可以分解在多个基本单元中、或分解在可以广泛遍布于文本文档上的多个“字节单元”中。这种“字节单元”尤其可以用于整合在文本符号中。如果用这种编码保护的文档被复制，那么这些符号中的至少一些符号将由于复制过程而被大大降级。因此，借助于该新编码技术本质上实现了复制检测。

著录项

公开/公告号CN105934780A

专利类型发明专利
公开/公告日2016-09-07

原文格式PDF
申请/专利权人卡巴-诺塔赛斯有限公司;
展开▼

申请/专利号CN201580005697.4
发明设计人简-弗里德里希·艾伦布罗克尔;沃尔克·洛韦格;
展开▼

申请日2015-01-28
分类号G07D7/00;G07D7/2033;
代理机构北京安信方达知识产权代理有限公司;
代理人陆建萍
地址瑞士洛桑市
入库时间 2023-06-19 00:27:32

法律信息

法律状态公告日

法律状态信息

法律状态
2019-04-26

授权

授权
2017-02-08

实质审查的生效 IPC(主分类):G07D7/00 申请日:20150128

实质审查的生效
2016-09-07

公开

公开

说明书

本发明总体上涉及打印文档的编码和认证、以及用于检测这种打印文档的复制的措施。

1.引言

在高度自动化和数字化世界中，经常有必要为物理对象添加数字标签以便创建物理世界与数字世界之间的连接。术语“数字标签”描述所有种类的附件，这些数字标签用于使物理对象是机器可读的。简单的数字标签仅存储信息(例如，2D码)。其他的数字标签允许阅读器与标签(例如，RFID、NFC和智能卡芯片)之间进行交互。标签在若干应用中是有用的。首先，那些标签用于自动化过程：它们允许更快速的处理并且还可以引起成本减小。此外，使用数字标签产生更容易且更加方便用户的操作并且因此可以减少错误。

人类对数字信息的非觉知性是数字标签的缺点之一。尤其是那些在不知道人类用户的情况下读取的标签还存在隐私问题和安全问题。取决于码设计，机器可读代码在没有技术系统的帮助下由人类解释是困难并且行不通的。本说明书关注于特殊的机器可读代码，该机器可读代码被专门设计成由相机和计算机读取并处理。基于光学处理的代码配置有附加特征，例如，纠错编码或针对裸眼的虚拟隐蔽性(参见[Kamijo2008])。

下文描述了新的2D码，在下文中被称为“微IDENT”码(或“mIC”)，其相比于其他标准2D码有能力包含更大量的数据。这是通过消除2D码中一些典型的检测图形实现的，这些典型的检测图形对于经由标准办公扫描仪和打印机的文档处理不是必需的。微IDENT码以这样一种方式被设计使得其可以被切割成可以遍布于安全文本文档上的多个信息块。信息块将被称为“微IDENT码字节单元”(“mIC-BU”或简称为“BU”)。这些mIC-BU的优点是它们可以隐藏在文本字体中。在复制之后，它们通常改变其拓扑并且可以因此用于复制检测。

本说明书如下组织而成：在此引言之后给出相关著作的一些深刻见解。此外，介绍了2D码设计中的一些基础。在第三部分，描述微IDENT方法和设计。下一个部分突出关于文档认证的发现和结果。第五部分对本说明书进行总结。

1.1发明内容

本发明的总体目的因此是提供一种简单的解决方案以允许对打印文档进行编码、认证和复制检测。

借助于在权利要求书中列举的系统实现了此目的。

具体地，存在一种用于对打印文档进行编码、认证和复制检测的要求保护的系统，其中，多个微二维打印码符号或字节单元散布在打印文档的整个打印表面上从而形成编码，每个字节单元由用于允许对该字节单元进行定位的寻像图形和承载一个字节数据的单个数据块以及被编码为黑白一位模块的一个奇偶校验位组成。根据本发明，这些字节单元以各自被白色静止区包围的打印点的形式散布在该打印文档的整个打印表面上，这些字节单元具有的打印尺寸使得该编码对裸眼不可见并且使得这些字节单元由于复制该打印文档而被降级，从而防止读出该打印文档的副本上的编码。

在本发明的背景下，“微”意味着足够小的打印尺寸，该打印尺寸确保由单独的字节单元实施的编码对裸眼而言不容易看见并且可以适当地隐藏在打印文档中，同时仍展现出由于复制而内在地被降级的结构，如在下文讨论的。在那个方面，单独的字节单元优选地具有小于0.5mm²的总打印面积，其中字节单元模块尺寸约为0.1mm×0.1mm至0.175mm×0.175mm。

有利地，这些字节单元分散在打印文本的区域上并且用作对i点、标点符号(“.”、“？”、“！”、“：”、“；”)中的点和/或取决于所使用的语言对用作如分音符(分音符号)或德语曲音符号(“¨”)等变音符的其他点的替代物。

在此上下文中，该系统尤其可以允许对较大的编码数据流进行编码。为此，编码数据流是由多个字节单元形成的，这些字节单元分散在打印文本的区域上、根据有待编码的相关数据流的字符长度和用于承载数据的相关打印文本的容量分散在一页或几页上。

编码数据流的每个单字母数字字符可以有利地映射到这些字节单元中的相应字节单元，这些字母数字字符优选地用ASCII码编码，其可以借助于任何给定的字节单元的数据块所承载的相关数据字节被适当地编码。

在优选变体的上下文中，完全相同的字节单元在该打印文档中被编码多次以实现冗余。在此具体上下文中，可以针对具有字符长度L的给定编码数据流以及具有数据承载能力C的给定打印文本，当针对该编码数据流的每个字符打印n＝k+1个完全相同的字节单元时实现最大冗余，k是用以下公式计算得到的整数：

k＝[C/L]-1。

在本发明的背景下，每个字节单元有利地由4×4个一位模块组成，其中寻像图形优选地由七个黑色模块组成，这些黑色模块在字节单元的一角处形成两条实线。

根据该系统的优选实施例，奇偶校验位被编码在每个字节单元的内部区域。常规地，奇偶校验位可以被设置为以下值：

$p = | (Σ_{i = 1}^{8} d_{i}) \mod 2 - 1 |$

其中，d_i(i＝{1，2，…，8}；d_i＝{0，1})是由该字节单元承载的相关数据字节的单数据位，出于拒收错误检测到的字节单元的目的，该数据位允许简单的校验和计算。

可以用现成的办公打印机、特别是可以用约1200dpi的打印分辨率进行打印的可商购的办公打印机，如激光打印机，打印本发明的字节单元。

还要求保护上述系统的、用于对办公打印机和扫描仪产生或处理的文档进行编码、认证和复制检测的用途。

1.2附图简要说明

本说明书参照以下附图：

图1是已知的EAN13条形码(参见，例如，http://en.wikipedia.org/wiki/EAN13)的图示，该条形码例如可以在Terry>http://www.terryburton.co.uk/barcodewriter)的帮助下生成；

图2(a)是已知的快速响应码或QR码(参见，例如，http://en.wikipedia.org/wiki/EAN13)的典型示例，该代码同样地可以在Terry>http://www.terryburton.co.uk/barcodewriter)的帮助下生成；

图2(b)是包含在图2(a)的QR码中的寻像图形(FP)之一的放大视图；

图3(a)和图3(b)是(a)数据矩阵码(参见，例如，http://en.wikipedia.org/wiki/Data_matrix_(computer))和(b)微IDENT码的图示，该数据矩阵码可以同样在Terry>http://www.terryburton.co.uk/barcodewriter)的帮助下生成；

图4(a)-(c)展示了在(a)原始状态、(b)打印状态和(c)复制状态下的微IDENT码的字节单元(BU)。

图5展示了在其中字节单元(BU)被用作i点的微IDENT码应用的示例。

图6(a)-(b)是微IDENT码字节单元(BU)或mIC-BU的设计拓扑的概览；

图7展示了在奇偶校验位的帮助下避免的可能的误检的案例；

图8是在其中用红色标记的mIC-BU分散在文本中的经编码的文档的摘录；

图9(a)-(c)展示了(a)用于检测的击中或击不中算子、(b)检测区域的示例以及(c)针对此示例的边界框和计算的面积；

图10是在不同的读出区域上的概览：FP区域(红色)、外部区域(蓝色)和内部区域(绿色)；

图11展示了针对用文本“ODS2014SanFrancisco”编码的说明性打印文档的每个字母数字字符的检测到的BU的数量；

图12展示了在打印文档的副本中针对每个字母数字字符检测到的BU的数量；并且

图13是所提出的位置编码的示例。

2.相关著作

2D码的起源基于所谓的条形码。条形码是由条(线)组成的机器可读代码。在图1中给出了这种编码的一个示例(即，所谓的EAN 13条形码，该条形码可以在Terry>http://www.terryburton.co.uk/barcodewriter)的帮助下生成)。EAN表示“欧洲商品编号”，但是现在已知为“国际商品编号”，尽管EAN首字母缩写已经被保留下来(同样参见http://en.wikipedia.org/wiki/EAN13)。EAN13条形码是13位(12个数据位和1个校验数位)条形码标准，该条形码标准广泛用于多种多样的应用(例如零售和物流)。

2.1>

大部分研究文献聚焦于移动设备的2D码。这是由于以下事实：当今的移动电话和智能电话无处不在(参见[Ericsson2013])。在不必稳定的环境中执行2D码采集应用。对比于在移动环境中使用2D码，有可能在其他应用中(如文档认证或工厂自动化(例如，用于检测工件))控制不同的环境因素。例如，高质量读出2D码的最重要的因素之一是照明。在移动应用中照明可能是不稳定的(参见[Tan2012])，而假定在办公环境下在文档认证应用时照明是稳定的。

还有可能针对2D码使用仅在特定照明下可见的油墨，从而允许在彼此的顶部上打印多个2D码。还有可能使用对环境起反应的油墨，像热变色油墨(参见[Peiris2011])。附加因素是相机在移动环境下的恒定运动，这需要次优图像处理条件。那些方面生成具有相对低的数据密度的移动2D码。大多数基于颜色的移动2D码仅使用最多四种不同颜色(参见[Tan2012])。

2.2>

当在相机和计算机的帮助下设计有待被记录并被处理的视觉代码时，必须考虑多个考虑因素。虽然这些考虑因素大多数倾向于针对所有视觉代码是类似的，但是它们中的一些取决于所讨论的代码的特定要求。每个2D码是由多个模块构成的。每个模块承载一位信息。这些模块被组合以形成码符号。许多2D码使用二次成形的模块，像广泛的“快速响应码”或“QR码”(http://en.wikipedia.org/wiki/QR_code)。在图2(a)中示出了典型的QR码，其中，一个模块由红色框标记。如例如在[Kato2010]中讨论的，模块形式的其他示例包括三角形模块(“大容量颜色条形码”)、在六边形栅格中安排的点模块(“最大码”)以及由圆形分段构成的模块(“短码”)。一些2D码使用多种颜色来增强数据容量。一个示例同样是大容量颜色条形码。每个2D码符号被静止区(没有任何模块)包围。静止区用作2D码符号与周围区域中的其他对象之间的分隔符。

2D码设计的一个挑战在于以下事实：一些设计要求与其他设计要求冲突。例如，为了更快阅读速度的优化将导致更小的数据容量，假定所使用的读取硬件和2D码的表面区域是完全相同的。优化要求的示例是2D码的可用性、读取速度、生产和运行成本、可靠性和安全性、安全、以及数据容量。

并非总是清楚2D码在图像内部所处的位置，或者在图像内部是否存在编码区域。因此，2D码通常使用特殊的图形或“寻像图形”(FP)以允许定位2D码。为了容易且快速检测2D码，这些寻像图形不同于2D码中的其余寻像图形。此外，FP通常用于推导2D码的取向。这个事实解释了为什么FP应独立于2D码的取向是可检测的。FP还应允许检测2D码的某些失真。此外，可以使用FP推导2D码模块的尺寸。图2(a)中示出了FP的一个示例，其示出了三个这种FP。FP具有一种特定的图形，该图形在2D码的其他区域内部不会被检测到。可以通过使用多个FP过滤图像的与一个FP类似的随机部分。此外，三个示出的FP相对于彼此呈90°定向，从而使能够推导2D码的取向。FP还从所有取向中是可检测的，因为该图形不依赖取向总是具有相同的黑白比率(参见图2(b))。

3.方法

在赝品抵制环境下的文档编码是已确立的话题，其主要基于光学方法(例如，参见[Hill2009])。然而，需要易生成且易检测的机制用于文档保护印章，这些印章出现在结关文件、证书以及尤其在现成打印机上打印的办公文档上(例如，参见[Iqbal2006])。此外，打印信息印章的数据密度应是密集且稳健的[Herrigel2008]。因此，复制的原始文件应被检测为复制的。

微IDENT码(mIC)的概念是基于散布在打印文本上的局部微编码印章(或“码符号”)。此外，微IDENT码可以通过简单地修改字母的几个部分而隐藏在标准文本中。这个修改通常是裸眼不可见的。通过复制文档，印章被部分地降级并且内容读出是不可能的。足够有趣的是，结果显示数据密度取决于所使用的书面语言。广泛的2D码(如QR码)被设计成用于移动应用中。当环境可控时，因为目前设想的应用是这种情况，所以有可能设置针对处理2D码的约束条件：

-2D码符号的取向是已知的，或至少限制于一定数量的可能状态(例如，处于90°角)，

-2D码符号的尺寸是已知且稳定的，

-2D码打印在平坦表面上并且与图像采集设备正确地对准。仅假定失真较小，

-环境条件是稳定的。

3.1一般案例

如果所有上述条件都满足，则可以减少未承载数据的模块的数量。这就是如何处理微IDENT码(参见图3(b))、在图3(a)中展示的数据矩阵码(例如，参见http://en.wikipedia.org/wiki/Data_matrix_(computer))的简化版。数据矩阵FP与QR码FP不一样大，因为仅使用了2D码符号的外线。符号的两侧是实线，而其他侧是虚线。如果存储的数据大于指定的量，那么多个数据矩阵块被组合在一个符号中(参见图3(a)，其中，一个块由红色长方形标记)。微IDENT码仅使用数据矩阵的两条实线和仅一个数据块，而不是像在数据矩阵情况下的多个数据块。

如果仅使用FP的一侧而其余侧用作数据区域，则一种甚至更简化的版本是有可能的。开发微IDENT码以用于文档认证。在相似大小噪声(“噪声”在这个具体上下文中被解释为打印的中断)的环境中打印该微IDENT码。由于这些条件，简化的FP被估计不足以在噪声与微IDENT码符号之间进行区分。为了检测FP，重要的是在mIC符号周围引入白色静止区。除了数据模块和寻像图形之外，大多数2D码还配备有纠错码(ECC)(参见[Reed1960])。通常，这种标准2D码的有效载荷在没有ECC和FP的情况下根据数据模块的尺寸和所使用的码高达约85％，微IDENT在之前给出的约束条件下能够实现约99％的有效载荷(参见[2012])。

3.2应用案例

微IDENT码可以在基本(“原子”)单元(所谓的字节单元(BU))中分成片段，这些字节单元由承载一字节有效载荷的单个数据块(DB)加上用于简单检错的一个奇偶校验位组成。图4(a)中给出了BU的示例。BU展现了缺口和针孔。那些缺口和针孔用于检测复制的数据，因为它们在打印和复制过程中变得模糊(参见图4(b)和图4(c))。BU尤其可以应用于书面字体，例如像i点(参见图5)或标点符号中的点。A4格式的页面可以包含几百个这种BU，这种BU可以用于文本编码、认证和/或复制检测，每个BU的总体尺寸在那方面小于0.5mm²。

3.2.1优点和局限性

首先，BU是为打印文档增添安全性的低成本方式。BU令人感兴趣，尤其是因为不需要特殊的硬件。替代地，微IDENT可以应用于在许多办公室中找到的激光打印机和扫描仪。因为在上述图5的应用示例中使用BU而非i点，所以对人类阅读器而言仅存在较小的破坏。该编码经常被观察器忽视并且被解释为发生在打印扫描过程中的正常失真。因此，其提供了隐藏为边缘效应的数据形式。一个局限性是可存储的数据量，因为它是由文档的字符内容(例如，i点)预先限定的。由于此局限性，可以使用BU作为一个字符串(例如，序列号)的载体。另一个应用领域可以是用作密码系统的附加物：字符串编码在BU中，该字符串随后用作密钥来解密数据。这将增添附加的安全层。BU在打印和扫描过程中由于缺失复杂的纠错而容易被破坏。这被称为瑕疵设计，因为此“瑕疵”用于使复制攻击困难。

3.2.2字节单元详细说明

因为每个mIC-BU承载一个字节数据，所以使用表述“字节单元”。此外，其还承载一个奇偶校验位。在图6(a)中详细展示了BU的另一个示例。红色边界区域(在BU的一个拐角处)被定义为FP。其他区域是数据区域(绿色边界)和奇偶校验位(蓝色区域)——它们联合形成具有3×3个模块的数据块(DB)。数据在模块中被编码为每模块一位。黑色模块等于值1而白色模块等于值0。这些模块按图6(b)中显示的递增顺序被扫描。此编号还用作单数据位d_i的索引，其中，i＝{1,2,…,8}且d_i＝{0,1}。奇偶校验位p被设置为以下值：

$p = | (Σ_{i = 1}^{8} d_{i}) \mod 2 - 1 | - - - (1)$

图6(b)示出了此编码图形的示例：d₁、d₂和d₅是黑色模块(即，其值为1)。因此，以上定义的等式(1)的结果是p＝0而奇偶校验位模块被设置为白色。在图7中示出了避免的遗漏检测。在此案例中，d₃被检测为0，而所有其他数据位被检测为1，即，p＝0(白色奇偶校验位)。在图7中可以观察到情况并非如此。因此，废弃此对象。

3.2.3原子分散

如在第3.2.2节中所描述的，针对大多数使用案例，一个单BU不能存储足够的信息。而是，它们被用作更大编码数据流的原子部分。在本说明书中提出的一种方法如下：

命题。形成完整数据流的字节单元分散在文本的所有区域上。它们例如根据所使用的语言被用作i点、标点符号中的点以及用作变音符(例如，德语“曲音符号”)的其他点的替代物。针对不同的语言，数据承载能力是不同的，因为点的出现在每种语言中是不同的。为了示出每种语言不同的编码能力，如在表1中所显示的，已经凭经验计算了语言统计。与所使用的语言无关，这些结果显示，用于将BU编码到文档中的方法是有希望的，因为数据承载能力高于单BU的使用。此外，该编码并不像较大的2D码那样干扰打印文档。由于这种编码方法，完整的文档用作编码区域，代替预先限定的较小区域。在图8中给出了此方法的示例，其示出了路易斯·卡罗尔的“Alice’s Adventures in Wonderland(爱丽丝仙境历险记)”的摘录。从上至下并且在BU具有相同竖直位置的情况中从左到右对引入的BU进行扫描。这种没有附加同步的位置读出方法是合适的，只因处理环境是稳定的。

表1：在文档内的所有点被mIC-BU代替的情况下，一页文档的不同语言存储容量。

3.2.4检测和解码

使用多个步骤来提高检测和解码速率。以下步骤主要目的在于减少错误肯定检测(例如，将正常的i点检测为BU)。基于扫描的8位灰度值图像执行检测和解码。启发式地创建在此过程中使用的所有阈值和击中或击不中算子(参见[Dougherty2003]，第4章，“击中或击不中变换(Hit-or-Miss Transform)”，第79页以下)。击中或击不中算子是用于二值图像对象检测的形态算子。BU的检测和解码可以被划分为以下部分：

通过击中或击不中算子检测可能的寻像图形。在此，在固定阈值T_bin的帮助下将灰度值图像转换成二值黑白图像。击中或击不中算子(参见图9(a))用于检测在图9(b)中用红色点示出的潜在FP。在本文中，在此操作过程中检测到的点被称为兴趣点(POI)。除了被废弃的那个点之外，检测出的POI彼此非常接近。

可能的BU检测。因为之前检测的POI表示BU(BU的FP)的可能的左下边缘，所以它们被用作跨越具有预先限定的尺寸的检测区域(或“检测框”)的起点。检测框是一个区域，BU可能位于其中并且在其中更精确的检查是有希望的。检测框的尺寸以BU的尺寸为导向，这由于打印尺寸和扫描仪分辨率而是已知。考虑到可能的失真和噪声，检测框被设置得大于BU的尺寸(参见图9(b)，其中，检测框用蓝色突出显示)。对象是黑色像素的连接区域。针对检测框内的每个对象，计算其面积和矩形边界框。因此，对象区域是形成对象的黑色像素的数量(在图9(c)中被标记为蓝色)。边界框表示围绕检测到的对象的最小的可能的矩形框(在图9(c)中被标记为绿色)。框的尺寸用作用于检测可能不正确的BU的一项措施：作为被白色静止区包围的完全BU，其在检测框被扩大时不改变其面积尺寸。与此事实相反，大多数其他检测到的物体在检测框被扩大时改变其面积尺寸。在图9(b)和图9(c)中观察到此效果的示例。读出检测到的可能BU是从之前生成的边界框开始的。该读出是在由边界框限定的区域内部执行的并且是基于原始灰度值图像。在BU读出过程中执行以下步骤：

BU的准确定位。这个步骤将忽略在可能的BU的边界处的失真。由于在打印扫描通道中发生的噪声，这些失真是不可避免的。

噪声检测器进行复制检测。噪声检测器检查程度增大的噪声是否发生在FP的边缘处。在理想情况下，FP的左侧由一条竖直边缘组织而没有水平边缘。在理想情况下，针对FP的底侧，存在一个水平边缘而没有竖直边缘。由于打印扫描过程将噪声引入到BU中，所以通过确定BU的边缘数量而检测到此噪声。针对左侧和底侧，给出边缘的数量。因此，FP的那些部分用于经由边缘检测器来检测噪声。具有阈值T_sobel＝25的索贝尔算子(Sobel-operator)(参见[Burger2009]，第135页以下)用于产生两张边缘图像(竖直边缘和水平边缘)。该阈值对于将索贝尔梯度图像转换成二值边缘图像而言是必要的。利用二值边缘图像来对边缘像素计数。检测到的水平边缘和竖直边缘的数量总和达到n_edge并且用于确定BU的复制版本的增强噪声级别：如果n_edge大于指定值T_noise，则废弃估计的对象。

子区域限定。模块由4×4个像素集群限定(即，每个BU总计十六个模块)。在图7中示出了这种划分的示例。

模块读出。在灰度值图像阈值化的帮助下读出每个模块。此阈值化是通过评估每个模块的平均灰度值确定的：

$q_{j} = (\begin{matrix} \begin{matrix} 1, & {\overline{M}}_{j} < T_{r o j} \\ 0, & {\overline{M}}_{j} \geq T_{r o j} \end{matrix} & = 1, 2, ..., 16 \end{matrix}) - - - (2)$

等式(2)表示属于模块M_j的所有灰度值。相应地，表示评估的模块的(算术)平均灰度值。阈值T_ro被适配于模块的位置，该模块位置是FP、外部区域或内部区域(参见图10)。相比于内部区域阈值和外部区域阈值，FP的阈值T_roj被设置为更低的值：恰当的FP模块必须一直具有低信号值(黑色)。此外，根据相邻模块的平均灰度值对T_roj进行适配。

在等式(3)中，参数T_posj表示模块的位置适配的阈值而T_nb是相邻模块的阈值。用表示相邻模块(左侧、右侧、顶侧和底侧)的多达4个不同的平均灰度值。T_roj如果相邻模块中的任何模块具有高于T_nb的平均灰度值那么由T_nb对T_roj进行适配。在计算等式(2)之后，针对每个评估的BU计算16个二进制值。在此所提出的技术被解释为二值化，因为其将8位灰度值图像映射到二进制值。在此所描述的方法不同于在[2012]中描述的方法，在其中代替8位灰度值图像，仅使用二值图像。相比于之前的方法，当前提出的方法产生相当好的结果。

FP存在。FP的存在是由之前计算的属于FP的q值校验的。如果一个或多个FP模块对应于为0的q值，那么整个BU被废弃。

校检和计算。针对每个检测到的可能BU计算校检和(奇偶校验位)。删除校验和错误的BU(参见等式(1))。

4.结果

此章节被划分为两个部分。在第一部分(第4.1节)，描述了文本数据编码，而在第二个更面向应用的部分(第4.2节)，解决了冗余复制检测。

4.1文本数据编码

BU编码在文本中以测试文件编码应用的编码能力和稳健性。通过使用mIC-BU对路易斯·卡罗尔的“Alice’s Adventures in Wonderland”的一页摘录进行编码。所应用的字体是字体大小为12pt的PostScript Times Roman。在用于测试的单页文本中恰好有两百个点。大多数点是i点，而所有其他点出现在标点符号中(.？！：；)。以0.127mm×0.127mm(0.005英寸×0.005英寸)的尺寸(或“字节单元模块尺寸”)打印BU模块。一个BU中的4×4个模块具有0.508mm×0.508mm(0.02英寸×0.02英寸)的尺寸，换言之，整个打印面积约为0.26mm²。

在每个页面上，五十个随机选择的点被BU替换。此外，BU内部保存的数据也是随机生成的。全部十页共有五百个BU被生成。用两个激光打印机(利盟C736dn型和兄弟DCP-8065DN型)以1200dpi的打印分辨率打印那十页。针对这个测试，两个打印机都被设置成黑白打印。兄弟DCP-8065DN型打印机还用作扫描仪来采集8位灰度值图像，其扫描分辨率被设置为1200dpi。计算时间在每页大致11秒与17秒之间。这些计算时间是在英特尔I7-2600k处理器上用并行的但非最佳的码在Matlab中获得。在没有打印或扫描的情况下，这些计算时间与算法的运行时间有关。在原始打印输出(平均计算时间：12.19秒)与副本(平均计算时间：15.69秒)之间的计算时间中存在巨大的差异。BU的量仍保持相同。表2示出了针对打印输出的单页的结果，而表3示出了针对复制的单页的结果。表2针对每个研究的打印机具有两个结果列。标上标签“(Correct)正确”的列对检测到的BU进行正确地求和。“Incorrect(错误)”列表示错误检测到的所有BU。这包括被检测为BU的i点，或错误读出的原始BU。如果校验和是有效的，那么有缺陷的BU可能被检测为有效的。这发生于BU的两个位被翻转的情况下。这些表的“组合”行中的百分比值基于由两个打印机打印的全部五百个BU。针对副本，不显示“正确”与“错误”之间的区别(表3)，因为理想上在副本之后应不会检测BU。因此，所有检测到的BU应是“错误的”BU。

表2：微型IDENT文本数据编码——检测到的BU——打印输出

表3：微IDENT文本数据编码——检测到的BU——副本

在表2中观察到，打印输出的检测速率约为90％。相比而言，针对打印输出的副本而言，几乎没有或者绝对没有出现检测到BU(表3)。这些结果清楚地显示mIC-BU是一种用于文档安全和复制检测的有效方法。通过在以下章节中描述的冗余编码方法实现了进一步的增强。

4.2冗余复制检测

一种使用mIC-BU的不同方法是用于复制检测的冗余编码。代替使数据内容最大化，冗余整合到打印数据中。完全相同的BU在一个文档中被多次编码以实现冗余。当计算可能的冗余时必须考虑两个约束条件：文档所提供的数据承载能力(C)以及必须编码的数据串的长度(L)，表述“数据串”在此上下文中表明编码在文档中的数据。参数C通过文档中的点数得出，其等于编码的BU的数量。参数L与在数据串中使用的字母数字字符的数量完全相同。单个字母数字字符是用7位ASCII码编码的并且映射到一个BU。因此，长度L可以用BU表达。加起来的冗余BU的最大可能量为：

k＝[C/L]-1(4)

在L≤C约束条件下。为了实现最大冗余，必须每编码字母数字字符打印具有完全相同数据的n＝k+1个BU。当被组合时，那n个BU形成一个码字。“码字”是单个代码元素。码字是由多个符号构建的。例如，二进制码字是由0和1构建的。具有长度为例如三个符号的二进制码字因此具有以下结构：010、111、001等。有可能计算这些码字的汉明距离(参见[Hamming1950])，这些汉明距离进而用于在读出后对这些码字进行分类。通常，在两个码字x＝(x₀，x₁，...，x_t)^T与y＝(y₀，y₁，...，y_t)^T(x≠y)之间的汉明距离被定义为：

$Δ (x, y) = Σ_{i = 1}^{t} d_{H} (x_{i}, y_{i}) - - - (5)$

其中，d_H(x_i，y_i)为：

$d_{H} (x_{i}, y_{i}) = (\begin{matrix} 0, & x_{i} = y_{i} \\ 1, & x_{i} \neq y_{i} \end{matrix}) - - - (6)$

并且t为两个码字的长度。参数Δ(x，y)表示必须被改变的码字x的数位数量，从而使得其被读取(分类)为码字y。在此章节中提出的冗余编码生成n/2的汉明距离：如果n个BU原始属于一个字符，那么n/2个BU必须改变以解释属于另一个字符的BU。此估计是保守的，因为在现实世界情景中不可能使得属于一个字符的n/2个BU恰好变为另一个字符的BU。更可能使得失真导致属于多个不同字符的BU或者一个字符的一些BU仅是不可检测的。利用汉明距离执行分类决策：为了检测字符，(在打印扫描过程之后)需要属于某个字符的多于n/2个检测到的BU。此外，定义：

a＝b/s(7)

其中，b是针对一个字符检测到的BU数量，而s是此字符在数据流中被编码的次数。变量a是用于分类决策的BU的数量。添加这个步骤，因为完全相同字符可以在数据流中出现多次。

在此具体示例中，文本“ODS2014SanFrancisco”被编码到一页文档中。在所使用的页面内的点数允许对恰好C＝200个BU进行编码。因为编码的文本“ODS2014SanFrancisco”包括L＝19个字符，所以使用k＝9的冗余度(通过应用以上等式(4))并且因此每个编码字符十个BU(n＝k+1＝10)。这进而导致总共一百九十(190)个编码BU。用于编码单个BU的位值是相应字符的二进制ASCII值(例如“D”-0100 0100)。所使用的打印机和扫描仪以及设置与第4.1节中的那些完全相同。显然，汉明距离为n/2＝5。图11示出了打印输出的结果，而图12示出了副本的结果。

这两个图都示出了针对每个码字检测到的BU的数量。对于一些码字，检测到的BU的数量不是整数，这可以发生在一个码字的多次出现被检测到的情况下(如之前所述)。尽管检测到BU，码字“u_1”(参见图11)和码字“u_2”(参见图12)标记未知(非原始编码的)。

打印输出的结果(参见图11)显示经编码的文本对于两个打印输出是可读的。实际上，所有码字的结果具有至n/2＝5个检测到的BU的判定边界的高距离，其中，仅十九分之二个结果与7个检测到的BU一样低。此外，仅一个BU(u_1)被错误地检测到。副本的结果(参见图12)显示几乎没有BU被检测到。有趣地，针对“u_2”的两个检测到的BU具有完全相同的数据值(0000 0000)。总之，这些结果显示mIC-BU非常适合于在文档安全复制检测领域中使用。

4.2.1位置编码

一种用于在单个字符之间进行区分的方式是使用位置编码代替使用在第4.2节中提出的估计技术。因此，提出嵌入在字节单元的单独位置中的附加信息层：整个编码区域被划分为多个更小的编码子区域，其中，每个子区域中的mIC-BU的数量用作第二信息层。在图13中示出了位置编码的一个示例。

示例。编码区域被划分成用红色线标记的6个子区域(参见图13)。BU由黑点标记并且在每个子区域的右下角示出每个编码子区域中的BU量。BU根据其位置被扫描。如在图13中表示的，扫描方向从上到下。如果多个BU存在于完全相同y水平面上，那么这些BU的扫描顺序变为x方向(从左到右)。尽管不是完全相同的y水平面，第一BU(左上)与最近的下一个BU之间的位置差保持所使用的子区域的信息。此信息根据在x维与y维中的距离差被编码。随后，较长距离的维度差除以较短维度的距离。在图13中，此数量为六，因为较长的y维距离约为较短距离的长度的六倍，从而使得编码子区域的数量也为6。

位置编码表示元信息层，该元信息层可以用作附加的安全特征。

5.结论

在本说明书中，提出了一种用于文档安全性应用的新编码技术。所提出的微IDENT编码(或“mIC”)是基于标准2D码的基本模块。所提出的mIC不利用标准2D码的一些特征，如大FP和纠错编码，由此增大数据密度。这种方法使能够打印输出微码符号，即，所谓的字节单元(BU)。由于较小的打印尺寸，将BU嵌入在文本文档中是可行的，从而代替文档中的例如i点和其他点。这导致了标准办公设备可使用的隐藏编码。已经成功论证此隐藏编码配备有复制即自毁特征。自毁是任何副本为原始BU码布局造成的小干扰(噪声)的结果。此外，实现了原始打印输出的高读出速率。

所提出的文本数据编码的一个缺点是原始打印输出中的数据损失。如上所述，读出速率高，但针对某个应用，此读出速率可能是不够的。这个问题可以通过所提出的基于冗余的编码来解决：在此，针对一个字符编码多个冗余BU。这种方法减小了可能的可存储数据量。然而，作为交换实现了针对编码字符的更高的检测速率。在测试中，所实现的检测速率是100％。这个方法的另一个益处是副本与原始打印输出之间的距离增大。总之，基于冗余的编码是增强文档复制检测的非常有用的方法并且可以用于安全打印应用。

参考文献

[Kamijo2008]

Kamijo K，Kamijo N，和Gang Z.，“Invisible Barcode With Optimized Error Correction(优化纠错隐形条形码)”，第十五届IEEE国际会议图像处理国际会议(ICIP)2008，2008年10月12日至15日，第2036-2039页

[Ericsson2013]

“Ericsson Mobility Report(爱立信移动报告)”2013年6月(http://www.ericsson.com/res/docs/2013/ericsson-mobility-report-june-2013.pdf)

[Tan2012]

Tan K.T.，Chai D.，Kato H.和Ong S.K.，“Designing a Color Barcode for Mobile Applications(设计移动应用的颜色条形码)”，说服性计算，IEEE，第11卷，第2期，第50-55页，2012年2月

[Peiris2011]

Peiris R.L.，Fernando O.N.N.和Cheok A.D.，“A Dynamic AR Marker for a Paper Based Temperature Sensor(纸基温度传感器的动态AR标记)”，环境智能，计算机科学讲义，第7040卷、第195-199页，2011

[Kato2010]

Kato H.，Tan K.T.和Chaid D.，“Barcodes for Mobile Devices(移动设备的条形码)”，ISBN 978-0-521-88839-4，剑桥大学出版社，第1版，2010

[Hill2009]

Hill S.，“The future of anticounterfeiting,brand protection and security packaging(防伪、品牌保护和安全包装的前景)”，Pira国际市场报告，2009年10月

[Iqbal2006]

lqbal T.，“High Capacity Analog Channels for Smart Documents(智能文档的大容量模拟通道)”，博士论文，Ingenieurwissenschaften derDuisburg-Essen，2006年8月17日

[Herrigel2008]

Herrigel A.,“Mobile Interaction and Document Authentication(移动交互和文档认证)”，SECUDE国际AG，光学安全性和赝品抵制会议，旧金山，加利福尼亚州，2008年1月23日至25日

[Reed1960]

Reed I.S.和Solomon G.，“Polynomial Codes Over Certain Finite Fields(在特定有限领域上的多项式编码)”，工业和应用数学学会期刊，第8卷，第300-305页，1960年6月

[2012]

J.-F.和Lohweg V.，“Video-Based Data Transfer for Document Authentication(文档认证的基于视频的数据传送)”，3.Jahresolloquium，“Bildverarbeitung in der Automation(BVAu)”，中心工业IT，Lemgo，inIT-Institut für industrielle Informationstechnik，2012年11月

[Dougherty2003]

Dougherty E.R.和Lotufo R.A.，“Hands-on Morphological Image Processing(实地形态学图像处理)”，ISBN 0-8194-4720-X，光学工程中的SPIE辅导文本，卷TT59，SPTE出版社，贝灵翰姆，2003

[Burger2009]

Burger W.和Burge M.J.，“Principles of Digital Image Processing/Fundamental Techniques(数字图像处理/基础技术的原理)”，ISBN978-1-84800-190-9，计算机科学本科论题，伦敦施普林格出版社，伦敦，第1版，2009

[Hamming1950]

Hamming R.W.，“Error Detecting and Error Correcting Codes(错误检测和纠错编码)”，贝尔系统技术期刊，第29卷，2号，第147-160页，1950年4月

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于打印文档的简单编码、认证和复制检测的系统 [P] . 中国专利： CN105934780B . 2019.04.26
2. 用于打印文档的简单编码、认证和复制检测的系统 [P] . 中国专利： CN105934780A . 2016-09-07
3. System for simple coding, authentication and copy detection of printed documents [P] . 美国专利： US9900463B2 . 2018-02-20

机译：用于对打印文档进行简单编码，认证和复印检测的系统
4. Simple encoding, authentication and copy detection system for printed documents [P] . 日本专利： JP6420840B2 . 2018-11-07

机译：用于打印文档的简单编码，认证和复印检测系统
5. Simple encoding, authentication and copy detection system for printed documents [P] . 日本专利： JP2017510132A . 2017-04-06

机译：用于打印文档的简单编码，认证和复印检测系统