首页> 中国专利> 跟踪电子出版物中的文档

跟踪电子出版物中的文档

摘要

一种用于跟踪出版物内电子文档的系统和方法。消息与所述电子文档关联以作为所述电子文档标识。所述消息的二进制表示被编码为定义几何形状的绘图布置的标记,所述标记将所述消息编码在所述标记的字形(例如,简单文本、单个字符、几何形状等等)中,或编码在单个字符的字形中以随后用作标记。所述标记被添加到所述电子文档,以便生成可跟踪的文档,所述可跟踪的文档具有所述消息作为所述出版物内标识。所述标记相对所述可跟踪的文档边界和/或中心被提供在特定位置。由此所形成的所述可跟踪的文档被添加到所述出版物上。为了跟踪所述文档,将所述出版物发送到实现钩子的电子扫描程序模块。所述钩子搜索所述标记中表示所述消息的所述几何形状。当发现时,所述标记允许获得与所述文档有关的位置信息,包括页面中的位置、页号、宽度、长度、X/Y比率等等。

著录项

  • 公开/公告号CN103999104A

    专利类型发明专利

  • 公开/公告日2014-08-20

    原文格式PDF

  • 申请/专利权人 盖伊·李·亨纳夫;

    申请/专利号CN201280046318.2

  • 发明设计人 盖伊·李·亨纳夫;

    申请日2012-09-17

  • 分类号G06Q10/10;G06F17/20;

  • 代理机构北京聿宏知识产权代理有限公司;

  • 代理人吴大建

  • 地址 加拿大魁北克

  • 入库时间 2023-12-17 01:34:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-22

    未缴年费专利权终止 IPC(主分类):G06F19/00 专利号:ZL2012800463182 申请日:20120917 授权公告日:20171117

    专利权的终止

  • 2017-11-17

    授权

    授权

  • 2014-10-22

    实质审查的生效 IPC(主分类):G06Q10/10 申请日:20120917

    实质审查的生效

  • 2014-08-20

    公开

    公开

说明书

背景

技术领域

所公开的主题大体涉及出版行业。具体地说,主题涉及一种用于跟踪出版物 中文档的系统和方法。

相关现有技术

添加标记以对文档、书籍或出版物进行限定是非常传统的发行方式。书籍标 题可以限定作为标记。尽管它并不是内容的一部分,但它却是对其进行标识并检 索的工作中的关键组分。此方法的电子索引版本使用类似原理。通常,ISBN(国 际标准书号)会考虑到像条形码那样与自动跟踪和非接触识别方法兼容的唯一参 考。

然而,尽管这些受限解决案是以某个出版物级(例如,书籍、杂志等等)存在, 但仍没有在出版物内的那种解决案。

要求对出版物内文档进行内部跟踪的领域之一是出版与广告行业,其中每一 个出版物通常由来自如文章、广告、相片等各种来源的若干通信片段构成。这些 文章/广告的作者或赞助需要知道如何对他们的通信片段进行处理。例如,作者需 要知道其出版物/广告/文档是否以正确尺寸、字体、x/y比率、页面中的位置等进 行出版,这样,作者就能向出版商结账。

另一实例包括要求内部参考并跟踪其广告和文档(例如,跟踪公司内的杂志、 广告、传单、法律文档、图表、计划等等)的公司。

这些出版过程涉及由各制造商制作的编辑软件。几乎所有这些软件都会允许 存储旨在限定内容而不作为内部的一部分的元(Meta)信息。为了解决上文所讨论 的问题,出版技术者(技术人员)增加其对嵌入文档中的元信息的使用。

即使存在一些JDF、XMP、DCM等元信息标准并且主动鼓励使用所述标准, 但以完全细分方式运作的软件供应商、服务公司、分销商、出版商、打印商、网 络出版商全都需要其自己的扩展。这就导致形成元信息的许多冗余模式而其之间 并无实桥。另外,嵌入文档中的元信息易于发生许多变更和劣化,这是因为在出 版链上的其中的一个过程并未识别出元信息,或是因为信息并未更新或未将其收 集在最终文档中。

因此,元信息的预期寿命实际很短,并且常常有意或者因所述元信息是未知 的或认为是不可靠或不适合的而来通过处理软件将其移除。

另外,网络上的内容联合使得元信息的使用要比预期更为繁琐,由此,常常 放松跟踪能力。

已经尝试在HTML领域中找出用于元信息部分的某些规则,但是存在许多 用于对同一信息编码的方法使得行业中的不同级别和部门的出版技术者感到困 扰,从而导致他们将规则改变成他们所理解的那样。

总之,元信息在生产链上因其它软件而损坏的可能性极高(当前90%)。

与元信息的使用关联的另一问题在于常常缺少给出关于文档内容的另外信 息的概念能力。常据估计,由于元信息是针对完全不同目的,因此,其与内容完 全无关。因此,通常并未适当编码并且解码像文档几何形状、定位、剪辑或甚至 是最终页码标注一样的信息。

因此,需要一种这样的系统和方法:在允许快速跟踪出版物内所嵌入的文档 而不毁坏或更改文档的内容/版型的同时,增加生产上并甚至媒介上携载的信息保 持载货消息(cargo message)完整的可能性。

概述

所有出版软件的共同点就是文档内容本身。因此,文本和其编写方式基本上 是文档中的最重视的组分。因此,本实施方案将标记并入作为文本中的文档或媒 体的图形元素,所述标记将消息嵌入其字形。在一个实施方案中,所述消息在屏 幕上并不可见,当打印在媒介(纸张等等)上时也是如此。在次优选的实施方案 中,所述消息可以仅仅在屏幕显示以及在打印时是明显的,而其同时保持处于允 许以所述媒体的电子描述语言(例如,页面文档语言和/或广播和窄播视频流语言) 来分析的状态。在另一实施方案中,要嵌入的所述消息无法被编码为文本内容, 但能作为非标记性文本,所述非标记性文本具有如特定条件下的文本图形表示等 相当自然但强制链接的元素。

本实施方案是将电子文档转换成可跟踪的电子文档。所述方法包括将消息 (数字、字母、字符、符号或其任何组合)转换成几何形状(标记),并将所述几何形 状添加到所述文档中、处于所述电子文档的边界/中心内的特定位置。所述消息可 以用作ID,用以基于所述标记的所述几何形状来标识并且跟踪所述出版物内所述 电子文档。

在一方面,提供一种用于使电子文档在电子出版物内可跟踪的方法,所述方 法包括:接收消息以与所述电子文档关联;将所述消息的二进制表示编码到标记 的字形中,包括在所述标记的所述字形内对所述二进制表示中的每个位绘制特定 几何形状,所述标记被编码为以电子格式的路径并且在屏幕显示上或在呈现时不 具有绘图能力;以及修改所述电子文档,包括将所述标记添加在处于所述电子文 档的所述边界上或内的任何用户所选位置处,以便形成可跟踪的文档,所述可跟 踪的文档具有所述消息作为标识以供用于在扫描所述出版物的电子页面描述语 言时定位所述出版物内所述电子文档。

在一个实施方案中,所述方法进一步包括通过所述电子文档生成所述消息。 例如,被编码在所述标记中的所述消息可以包含通过分析所述文档本身而收集的 信息。本实施方案中,所述方法可以进一步包括:分析所述文档;提取与所述电 子文档有关的信息,包括以下项中的至少一个:文档尺寸、作者名称、剪辑路径、 生产信息、页边、标记之间关系;以及将所述信息中的一个或多个并入所述消息 中。

在另一实施方案中,接收消息包括以下项中的一个:从用户处接收所述消息; 以及从自动消息生成程序处接收所述消息。

在又一实施方案中,所述方法进一步包括将所述标记提供在虚位文档 (phantom document)中、相对所述虚位文档边界和/或中心位于特定位置。

在另一实施方案中,所述虚位文档具有矩形形状,所述方法进一步包括:在 所述虚位文档中的相对转角处提供两个标记;在所述电子文档上展开所述虚位文 档,以便界定所述电子文档上的对角边界。

在另一实施方案中,所述方法进一步包括在所述文档上展开所述虚位文档。

在又一实施方案中,所述方法进一步包括搜索所述电子文档中的未使用的字 符,并且以所述未使用的字符的字体提供所述标记。

在另一实施方案中,所述方法进一步包括以使用过的字符的所述字体提供所 述标记。

在另一实施方案中,所述方法进一步包括提供从限定所述字体的外围的线路 的迂回,以便将所述标记包括在现有字符的所述字形内。

在又一实施方案中,所述方法进一步包括在所述标记的所述字形内提供具有 唯一几何形状的信标(beacon),以在扫描所述出版物时标示所述消息存在。

在另一实施方案中,所述方法进一步包括至少在所述消息前将所述信标提供 在所述标记的所述字形内。

在另一实施方案中,所述信标包括了起点和终点,所述方法进一步包括:在 所述消息前提供所述起点,并且在所述消息后提供所述终点。

在又一实施方案中,所述信标的所述几何形状与表示所述唯一消息的每个位 的所述几何形状不同。

在另一实施方案中,所述方法进一步包括:如果在整个出版过程中移除对述 标记的字体描述,那么将所述虚位文档中的所述标记映射到空格或制表符。以便 避免文本更改。

在另一实施方案中,所述方法包括将所述可跟踪的文档并入到所述出版物 内。在又一实施方案中,所述方法进一步包括实现包括了钩子(hook)的扫描程序 模块,所述钩子用于基于所述几何形状来跟踪所述出版物内所述可跟踪的文档, 所述几何形状表示所述标记中嵌入的所述消息的所述二进制表示。

在另一实施方案中,所述方法进一步包括使用与所述出版物的格式兼容的解 释程序对所述出版物进行电子处理。

在另一实施方案中,所述方法进一步包括通过所述标记,获取所述电子文档 在所述出版物内的位置信息,所述位置信息包括以下项中的至少一个:页面中的 位置、页面尺寸、剪辑路径、当前色彩以及x/y比率。

在又一实施方案中,所述方法进一步包括提供采用PostScript库、绘图库的 其它格式的插件或拦截程序形式的所述钩子。

在另一实施方案中,所述标记具有与其背景大致相同的色彩以使其对用户是 不可见的。

在另一实施方案中,所述方法进一步包括以具有唯一名称的新的字体嵌入所 述标记。所述方法可以包括从所述文档中将所述字体去嵌入化,并且在解码时间 上重新赋予所述字体。还有可能在远程位点处提供所述新的字体。

另一方面,提供能够访问计算机指令以实现上述方法的计算机。

另一方面,提供用于跟踪出版物内电子文档的装置,所述装置包括:标记生 成模块,所述标记生成模块用于生成标记,所述标记具有在其字形中编码的多个 几何形状,每个几何形状表示消息的二进制表示的位,所述标记被编码为以电子 格式的路径并且在屏幕显示上或在呈现时不具有绘图能力;文档跟踪模块,所述 文档跟踪模块用于修改所述电子文档,包括将所述标记添加到所述电子文档,以 便生成可跟踪的文档,所述可跟踪的文档具有所述消息作为标识以供用于在扫描 所述出版物的电子页面描述语言时定位所述出版物内所述电子文档。

在一个实施方案中,所述装置进一步包括:文档分析程序,所述文档分析程 序用于分析所述文档,且提取与所述电子文档有关的信息,包括以下项中的至少 一个:文档尺寸、作者名称、剪辑路径、生产信息、页边、标记之间关系;以及 消息生成程序,所述消息生成程序用于将所述信息中的至少一个并入所述消息 中。

在另一实施方案中,所述标记相对所述电子文档边界和/或中心被提供在特 定位置。

在另一实施方案中,所述标记提供在虚位文档中,所述虚位文档适配用于在 所述电子文档上展开,以便生成可跟踪的文档,其中所述标记相对所述可跟踪的 文档边界和/或中心被提供在特定位置。

在又一实施方案中,所述虚位文档是矩形的并且包括提供在其相对转角处的 两个标记。

在另一实施方案中,对所述标记进行定义的所述几何形状包括彼此并排地重 叠的多个单元,每个单元表示所述消息的所述二进制表示中的逻辑0和逻辑1中 的一个。

在另一实施方案中,所述标记具有矩形或弧形的形状。

在又一实施方案中,所述装置进一步包括扫描程序模块,所述扫描程序模块 用于基于表示所述消息的所述几何形状来跟踪所述出版物内所述可跟踪的文档。

又一方面,提供一种包括处理器的装置,所述处理器能访问由所述处理器执 行的一个或多个程序,从而生成虚位文档以供用于使电子出版物内电子文档可跟 踪,所述装置包括:标记生成模块,所述标记生成模块用于生成标记,所述标记 具有在其字形中编码的多个几何形状,每个几何形状表示消息的二进制表示的 位,所述标记被编码为以电子格式的路径并且在屏幕显示上或在呈现时不具有绘 图能力;以及虚位文档生成模块,所述虚位文档生成模块具有相对所述虚位文档 边界和/或中心提供在已知位置的所述标记;其中所述虚位文档适配用于添加到所 述电子文档以使所述电子文档可跟踪并且具有所述消息作为所述出版物内标识。

在一个实施方案中,所述虚位文档适配用于在所述电子文档上展开,以便生 成可跟踪的文档,所述可跟踪的文档具有所述消息作为所述出版物内标识。

另一方面,提供一种用于生成虚位文档以供用于使电子文档在电子出版物内 可跟踪的方法,所述方法包括:接收消息;将所述消息的二进制表示编码在标记 的字形中,包括在所述标记的所述字形内为所述二进制表示的每个位绘制特定几 何形状,所述标记被编码为以电子格式的路径并且在屏幕显示上或在呈现时不具 有绘图能力;以及生成虚位文档,所述虚位文档具有相对所述虚位文档边界和/ 或中心提供在已知位置的所述标记,所述虚位文档适配用于添加到所述电子文档 以使所述电子文档可跟踪并且具有所述消息作为所述出版物内标识。

另一方面,提供一种用于将电子文档转换成可在出版物内进行跟踪的可跟踪 的电子文档的方法,所述系统包括:将消息转换成标记,包括在所述标记的字形 内对所述消息的二进制表示的每个位绘制特定几何形状,其中所述标记被编码为 以电子格式的路径并且在屏幕显示上或在呈现时不具有绘图能力;以及修改所述 电子文档,包括将所述标记合并到所述电子文档中以形成可跟踪的电子文档,所 述可跟踪的电子文档具有所述消息作为标识以供用于在扫描所述出版物的电子 页面描述语言时定位所述出版物内所述电子文档。

在一个实施方案中,所述方法进一步包括将所述标记提供在所述电子文档边 界和/或中心内的特定位置。

又一方面,提供一种包括处理器的系统,所述处理器能访问由所述处理器执 行的一个或多个程序,从而将电子文档转换成出版物内可跟踪的电子文档,所述 系统包括:标记生成模块,所述标记生成模块用于生成标记,所述标记具有在其 字形中编码的多个几何形状,每个几何形状表示消息的二进制表示的位,所述标 记被编码为以电子格式的路径并且在屏幕显示上或在呈现时不具有绘图能力;以 及转换模块,所述转换模块用于将所述标记合并到所述电子文档中以将所述电子 文档转换成可跟踪的电子文档,所述可跟踪的文档具有所述消息作为标识以供用 于在扫描所述出版物的电子页面描述语言时定位所述出版物内所述电子文档。

在一个实施方案中,所述转换模块将所述标记提供在所述电子文档边界和/ 或中心内的特定位置。

下文定义以下术语:

出版物

出版物是至少一个页面的集合。每个页面由至少一个文档构成。出版物的实 例包括但不限于书籍、杂志、HTML页面、内部文档等等。出版物的文件格式实 例是Microsoft DOC、Microsoft XPS、Open Office ODS、Adobe PS、PDF或EPSF、 W3C、HTML、SWF容器等等。

文档

文档是包括图形、文本、图像中的至少一个或其任何组合的通信片段。文档 可为图像、短文、广告等等,并且可以具有任何尺寸并且甚至具有不规则的轮廓。 例如,定形成波形的广告标示着其可由可编辑的文本环绕。文档文件格式的实例 是Microsoft DOC、Microsoft XPS、Open Office ODS、Adobe PS、jpg、tiff、PDF 或EPSF、W3C a HTML或者SWF等等。文档实例包括:报纸中的广告。文档还 可以是视频作品,其使用了涉及像w2c SVG、Adobe Flash、Pixar RENDERMAN、 Autocad DXF一样的图形元素的描述来并入图形内容。

子文档

子文档是属于另一文档的一部分的文档。比起分类,这更会是一种分层标识。 通常,子文档的文件格式与文档是相同的。

页面

页面是基本读物单元。它可包含被限定为可编辑的主要内容,并可包含广告。 可编辑的部分以及广告部分被认为是页面内的“文档”。文档跨过一个以上页面是 可能发生的。

标记

标记(又名戳印)是包括规则和不规则形状的几何形状(例如,矩形、弧形、圆 形等等)。本实施方案中,所述标记包括其中所嵌入的消息。所述消息可以用作唯 一标识以便跟踪出版物内文档。本发明的实施方案添加标记并在嵌入出版物中所 提供的文档内时检索所述标记。

字形

字形是字符的图形表示。例如:BBBB表示字符“B”的不同字形。过去,所 述字形被理解为以图形方式显示的字符。字词字形常用字词“字符”替代,但计算 机已经允许以更灵活的方式绘制字符并且允许在字符代码与绘图集合之间建立 灵活关系(称作将其打印出来所要求的字形)。引申开来,这是通常使用由矢量或 曲线形成的路径的集合在光栅中呈现字符方面所必需的图形操作集合。

字体

字体是字形和关联机制的构建集合,用以表示在要求特定字符代码时应当考 虑呈现出的字形。

轮廓

此后,轮廓指定字符但不作为字符代码初始形状,而是作为限定所述字符轮 廓以便如预期那样对其进行绘制的形状集合。对字母的这种描述不可编辑,除非 被看做是填充色彩或纹理的曲线集合。例如,在处理标志、商标或类似物时,将 字符字形转换成轮廓存在技术原因。也还存在技术理由,因为如果文本仍是来自 某字体的字符,就会难以施加技术者所要求的美学失真。因此,软件制造商可内 部做出决策以将关联字形转换成轮廓或绘图,而不发出警告。本实施方案在此情 况下通过添加对解码的另外适配而来涉及这种转换,这会进一步进行解释。

如附图中示出,本主体的特征以及优点将从所选实施方案的以下详述中显而 易见。应认识到,所公开并主张的本主题能在各个方面进行修改,所有修改不与 权利要求书的范围背离。因此,附图和说明书在本质上视为说明性的,而非视为 限制性的,并且本主题的完整范围会在权利要求书中阐明。

附图简述

结合附图,本公开的另外特征以及优点将从以下详述显而易见,在附图中:

图1a至1d示出根据一个实施方案的形成出版物内可跟踪的文档的不同阶 段;

图1e和1f示出虚位文档的实施例,在所述虚位文档中,标记提供在除了虚 位文档转角外的区域上;

图2a和2b示出指定逻辑1的单元的实施方案;

图2c和2d示出指定逻辑0的单元的实施方案;

图3a和3b示出其中单元以弧形形状提供的实施方案,其中分别地说,带半 摆的弧形指定逻辑1并且带全摆的弧形指定逻辑1;

图4a示出采用ASCII代码的作为消息的字母“H”的二进制表示(01001000);

图4b示出根据一个实施方案的示例信标中的单元;

图5示出标记的字形的放大版本,其包括了在某个距离处彼此重叠并嵌入与 标记所使用的特定字符关联的字体的字形部分中的若干单元;

图6a示出不规则定形的文档;

图6b示出包括了多个标记的虚位文档;

图6c示出包括了两个以上标记的可跟踪的文档124;

图6d示出在出版物页面中的图6c所示不规则的可跟踪的文档;

图7a示出展示在借用未使用的条目前字符和其字形表示的映射表;

图7b示出展示在借用未使用的条目后字符和其字形表示的映射表;

图7c示出包括在字符A的字形部分中的标记的实施例;

图7d示出将标记并入现有字体路径上以使标记实际是不可见的实施例;

图8a是将虚位文档表示为使用类型3Postscript字体的EPSF的子文档的实 施例;

图8b是将虚位文档表示为可在HTML中引用的SVG的子文档的实施例;

图8c是表示其中字体和其字形消息被定义在远程位点的虚位标记的子文档 的实施例;

图9示出来自单页出版物的采用XML的示例扫描程序报告,图9是图9a 和图9b的叠加;

图9a包括跟踪其中字形被转换成文档中的轮廓的标记的结果;

图9b示出跟踪其中字形可从包括可编辑的文本的文档中的字体字形库直接 获取的标记的结果;

图10是示出一种用于扫描出版物的方法的流程图;

图11是示出一种用于跟踪出版物内电子文档的一般方法的流程图;

图12是一种用于生成出版物内可跟踪的电子文档的示例系统的方框图;以 及

图13是根据一个实施方案的示出一种用于跟踪出版物内电子文档的方法的 流程图;

图14是根据实现方式中的第二实施方案的一种用于生成出版物内可跟踪的 电子文档的示例系统的方框图;

图15是根据第二实施方案的一种用于跟踪电子文档的方法的流程图;

图16是根据另一实施方案的一种用于生成虚位文档的示例系统的方框图; 以及

图17是示出用于形成虚位文档以供用于跟踪电子文档的流程图。

应当注意,在整个附图中,相似特征是以相似参考编号标识。

详述

本实施方案对一种用于跟踪出版物内电子文档的系统和方法进行描述。消息 被关联到文档作为文档唯一标识。消息的二进制表示被编码为在特定所选字符的 字形表示中的几何形状。至少一个特定字符通过形成或者修改特定字体来与这种 字形关联。对于标记内的至少一个特定字符,字体使用至少一次。这样,标记最 终并不包含消息作为显式文本,而只作为由引用了特制字形的单个字符构成的简 单文本。消息本身在标记所用字体的字形中编码为以定义位流的方式来布置的一 组几何形状,其中各方面的更改可以通过对文档的电子处理进行识别并且解码。

实现方式中的第一实施方案

在实现方式中的第一实施方案中,标记通常在其由技术者进行递送前是由所 述技术者集成在文档中。由于标记固定在前递送,因此,能准备的信息极少。

然而,曾经在文档中的标记位置保持可跟踪的。这样就有可能将标记设定在 特定位置,并且稍后在扫描时间上报告这些位置以及像用于跟踪文档几何形状的 ID的消息部分。

为了帮助将这些预定义的消息标记插入文档中,可在子文档中供应标记,子 文档是旨在使得技术者易于插入至少一个标记并优选地易于插入至少两个标记。 这是通过使用在设计前递送并包含标记集合的文档实现。这种文档称作虚位文 档。

虚位文档定义可展开的几何形状,可以在文档上拖动并且展开所述可展开的 几何形状,以使文档在出版物内可跟踪。标记或标记集合是相对文档边界被提供 在特定位置。优选地是,虚位文档定义矩形并且包括位于矩形相对转角处的两个 标记。这个过程使用虚位文档作为对设定在特定位置的这些标记的支持。

由此所形成的可跟踪的文档添加到出版物。当有跟踪文档的理由时,将出版 物发送到实现钩子的电子扫描程序模块。钩子搜索表示在标记中的消息的几何形 状。当发现时,标记触发钩子就此时所发现的标记位置以及可从出版物的页面报 告出的其它类型情报向绘图扫描程序进行询问。这就允许获得与文档有关的位置 信息,包括页面中的位置、页号、宽度、长度、X/Y比率等等。

图1a至1d示出根据一个实施方案的形成出版物内可跟踪的文档的不同阶 段。图1a示出出版物中包括的文档的实施例。例如,所述文档100可为以下的一 个或其组合:照片、文本、图形、图表。如果文档100并非是电子的,那么扫描 所述文档100以便得到所述文档100的可以使用计算机来操控的电子副本是可能 的。

要嵌入的消息内容相对过程并不重要,并且甚至可以在标记文档后从文档中 提取或者修补。通常,消息需要允许在一定程度上跟踪文档,并且可以用作ID。 消息可以包含ID,所述ID允许获得数据库中对与子文档或文档有关的所有相关 信息的引用。ID部分通常可以从数据库供应,或生成为像16字符统一资源名称 (URN)一样的可稍后索引的唯一ID。

图1b是虚位文档102的实施例。虚位文档包括两个标记104和106。标记 104和106可包括在虚位文档102的相对末端处。虚位文档维度可以调整,由此, 虚位文档102可以展开和/或转动以便配合在文档100上。例如,如果文档100是 由某个公司提供给广告代理以将其出版在报纸中或其网站上的广告,那么广告代 理处的技术人员就将虚位文档102在广告文档100上展开以便形成可跟踪的文档 108,如图1c所示。随后,可跟踪的文档108放置在出版物的页面110中,如图 1d所示。

在第一实施方案变体中,这种过程可以通过以下方式自动进行:允许设计人 员在采用最终格式后提交其文档到过程,所述过程将会打开文档并且在所有其它 子文档的下方通过适当展开来将虚位文档自动嵌入,最后根据背景调整色彩,并 且搜索像PDF说明书中定义为“TrimBox”(它已知是在剪切文档中的页边(出血)部 分后所留下的打印区域)一样的另外尺寸调整信息,或者搜索对于读者来说是可视 区域的HTML中的第一<TABLE>或<DIV>操作符。

尽管图1a至1d示出标记被包括在文档100的顶部右侧和底部左侧,但应注 意,本实施方案不限于这种情景。标记104和106可以用在文档内的任何地方, 只要用户保持跟踪其相对文档边界的位置即可。

如名称所指示,虚位文档102是这样的文档:存在于出版物110内而对人眼 不可见,以便避免读者感到不便/混淆。在第一实施方案中,虚位文档在设计与出 版物一起使用前自动生成。图1b至1d示出仅仅为了清楚起见而可见的标记104 和106。然而,应当注意,标记104和106并不具有可打印的维度,或者在次优 选的实施方案中,它们可以具有仅仅电子扫描器能通过解释出版物的页面描述语 言检测出的小维度和色彩,如将在下文中进一步详细描述。换句话说,光学扫描 文档在其上打印的媒介或文档在其上示出的显示器无法检测标记,因为标记并不 允许沿深度轴线的位流重构并且这是出于许多原因,其中包括表示位的几何形状 重叠这一事实以及标记可能并不存在于显示器或打印媒介上这一事实。

即使虚位文档可以展开和/或转动以便配合在出版物中文档上,但也极精确 地跟踪标记位置以便标记文档界线作为参考,使得用户可以用来指定对稍后将发 生的跟踪过程的几何调用而没有处理不可见的字符的负担。在一个实施方案中, 标记可为完全不可见的,并且可映射到“空格”和“制表”作为无论如何都将调用经 适当编码的消息字形的关键字符。这也将在下文进行进一步详细描述。

一旦并入文档之中,虚位文档充当了子文档。

另一实施方案允许将与虚位文档边缘的距离编码为消息本身的一部分。在这 种情况中,标记并不一定被假定为强加在虚位文档对角转角上,解码过程可以使 用标记中嵌入的信息、随后使用此时所发现的标记经分析的位置而来重构原始虚 位文档边缘,解码过程可以推断已经应用于虚位文档的展开参数。这最终会允许 对进入出版物的最终文档尺寸有相同完全了解。这种实现方式的实施例在图1e 和1f中示出。

实现方式中的第二实施方案

在第二实施方案中,标记在文档可提供给过程后生成。在这个实施方案中, 从文档中直接收集到的另外信息允许通过文档几何形状富集标记中的消息,所述 另外信息包括标记不规则的路径以及像作者、日期等与元信息类有关的信息。

第一实施方案中的益处得以维持。另外,第二实施方案添加其它能力以便使 用文档中的可用元素。消息还可包括像“ArtBox”(它是据说由界定文档实际内容的 最小矩形所限定的区域)一样的许多信息集合,这就允许稍后使用标准化的标准检 查出版物中文档的可见性。这个实施方案不仅允许检索信息以便编码在消息中, 还会允许重新使用现有元素作为过程的一部分。具体地说,消息字形能以已经嵌 入文档中的字体注入,这将在下文中进一步详细描述。

在第二实施方案中,如下执行消息生成:将文档发送到文档分析程序。文档 分析程序分析文档,并且提取与文档有关的信息,如文档尺寸、作者、标记之间 关系、剪辑路径、生产信息、页边等。这种信息随后被发送到消息生成程序以生 成包括上述信息中的一些或者全部的消息。随后,将消息编码在字符字形中。这 将参照图14在下文中进一步详细描述。

与字形中的消息有关的一般考虑

当消息使用考虑到完整8位的过程进行编码时,也会允许存储二进制的信 息。这就允许使用压缩以及像MD5散列一样的签名方法,或者使用对称或不对 称加密。对消息的这种处理是非限制性的并可以是可累积的。在生成字形编码前, 全都是可用的。本实施方案会允许对同一标记中实际无限量的数据进行编码。这 将仅仅增加电子文档尺寸,而并不对显示器或纸张上的最终呈现内容造成任何影 响。这将类似这种情况:沿深度轴线(例如,Z轴)添加数据,但在X和Y维度中 并未示出或者呈现或展示在这种情况中表示显示器或纸张上的最终呈现内容的 内容。

对复杂字形编码的能力是通过以下方式易于实现的要求:存在设计用于允许 复杂字符像亚洲语言字形一样编码的字体格式,以使字形本身可以包含大量信 息。如果单个字形并不足以容纳完整消息,那么过程可以将消息分在也将与可在 同一标记中使用的不同特定字符关联的多个字形中。

页面或出版物可以包括多个子文档。在主要实施方案中,文档可以包括多个 虚位子文档。这意味着多个标记集合可以共存在同一文档内,其中每个都可具有 不同目的。要么因为文档本身嵌套另一经标记的文档(这可发生在第一实施方案和 第二实施方案),要么为了描述文档中的像有版权的图像界限或者特定段落或字词 一样的多个元素(这些是更适用于第二实施方案的特征)。

在一个实施方案中,用户可以使用基于用户所输入的消息来产生标记的程序 将个性化的消息嵌入标记中。例如,为了跟踪属于公司的广告,将字词 “Pepsi”的二进制表示嵌入标记字形部分中是可能的。

当完整提供文档时,文档内容甚至可以密封或者一些元素可以单独签名,这 样就可在消息中跟踪每个信息,像对图像或甚至最终带有一些位置元素的文本进 行md5散列以便加密文档内容。

跟踪出版物内文档

在一个实施方案中,标记包括在标记的字体/形状(字形部分)中以位级(逻辑0 和逻辑1)来编码的唯一消息。消息可由用户输入,或可由计算机生成和/或被存储 在数据库中。消息可为字符、数字等等。本实施方案中,标记是其中嵌入唯一消 息的几何形状,它可以是规则的或不规则的。消息稍后将与文档关联,并且可以 用于使用电子扫描程序或钩子(软件)来跟踪出版物内文档。

在非限制性的实施例中,在字形描述的几何形状中的编码可以具有如图1b 所示矩形形状。在此实施例中,每个字形包括了一个或多个单元,并且每个单元 包括具有预定宽度和高度的矩形。在实现方式的一个实施例中,垂线在中间穿过 单元指定逻辑1,而垂线在单元边缘上则指定逻辑0。这种方法在方向向上或者 向下时是不变的,这就允许下一个位编码是从前一个位转角开始而不使得当前位 置偏移,从而减少对用于形成字形路径的矢量的数量的要求。然而,标记本身可 以转动。这种概念在基线已知后仍然适用,所述基线在分析编码的第一行的轴线 时可以立即推导得出。字形几何形状编码的其它实施例在图3a和3b中提供,图 3a和3b示出其中标记/单元以弧形形式提供的另一实施方案。例如,分别地说, 带半摆的弧形指定逻辑1,并且带全摆的弧形指定逻辑0。

在另一实施方案中,信标用于表示消息存在。信标至少在消息起点处供在 一个实施方案中,整个消息提供在信标的起点和终点内。在另一实施方案中,消 息中的每个字节以信标开始和结束。信标通常是足够的,但也可能使用在消息起 点处所提供的特定模型。图4a示出采用ASCII代码(01001000)的作为消息的字母 “H”的二进制表示。如图4所示,消息(01001000)的二进制代码提供在包括两个单 元sa、sb的开始信标与同样包括两个单元ea、eb的结束信标之间。在这种情况 中,消息是采用ASCII代码的字母H。信标中的单元定义特定模型,以便允许在 扫描过程中获得与单元尺寸有关的信息。同样,在文档转动或展开的情况中,单 元尺寸的x/y比率可以改变。在这种情况中,信标单元可以用于建立基线以对消 息进行解码。因此,由于它们形状特定,信标中的单元可以用于扫描目的。捕获 机制(钩子)期望对每个单元绘图、尤其是开始信标的相干性最小。图4b示出根据 一个实施方案的示例信标中的单元。在本实施例中,不同行的单元所用模型应与 以下规则顺序符合:

-1和2需要垂直;

-3应当是1的50%;

-4应当与2相同但180度定向;

-5应当与3相同;以及

-最后的当前点应当返回到开始点。

另外,对于每个字节,每个随后的位单元应当仅仅遵循单元方向以及尺寸。

单元无法与几何形状指导相符合将会导致拒绝在编码潜在消息时考虑字形。 针对何时对出版物进行扫描以便表示消息存在搜索模型。对测试的逐步组织允许 对不太可能的匹配进行快速拒绝。

为了将整个消息嵌入标记中,并且同时减小页面上的标记尺寸(在标记实际 打印出的情况下),若干单元(位)在一个实施方案中以两者之间最小可能距离来彼 此并排重叠,或者根据另一实施方案以上下叠合的方式完全重叠。对第一实施方 案的示例图示在图5中提供。图5示出标记104的放大版本,其包括了彼此以某 个距离重叠以便读者易于理解并且嵌入在标记字形部分中的若干单元。然而,如 在标记106中,单元还能以一个单元位于另一单元上方的重叠方式提供。如上所 述,在优选实施方案中,标记并不存在于页面上,但是如果存在,那么如在106 中,所述标记将看上去像其中中间存在线的薄矩形,这可使得图2a至2d中示例 的所有的位彼此重叠。

如在上文讨论,标记104/106可以用于提供出版物的页面内文档的位置信息。 在实现方式的一个实施例中,标记104和106提供在需要被跟踪的文档100(参见 图1d)的相对末端,以便标记文档100上的对角边界。每个标记的坐标可用于确 定文档并且最终任何子文档在页面内的位置(左、右、中间、底部、顶部、中心等 等)、文档尺寸(宽度和长度)、x/y比率以及其它信息。

在另一实施方案中,标记104和106可在文档内任何地方使用,只要用户保 持跟踪标记相对文档边界的位置即可,如在上文讨论并在图1e和1f中示出。

在文档具有不规则的形状情况下,两个以上标记用于虚位文档。图6a示出 不规则定形的文档120。图6b示出包括了多个标记的虚位文档。本文档中,不规 则的文档120在虚位文档122上拖动(反之亦然)以便标记不规则的文档120的转 角中的一些或者全部。图6c示出包括两个以上标记的可跟踪的文档124,并且图 6d示出出版物的页面126中的不规则的可跟踪的文档124。如附图中示出,虚位 文档可构建为标记网格,以便允许在出版和扫描过程期间针对每个标记单独对可 见性机械能监测,这就允许建立文档轮廓模型。根据网格粒度,这种粗略方法满 足许多用途需要并仍允许在无任何假定或最终文档几何形状的先验知识的设计 前将虚位文档递送给技术者。

至少可用于第二实施方案的一种替代方法使用对标记生成前已知的文档几 何形状的解码,以便形成添加到标记消息,例如,在ID后的汇编。这可包括与标 记有关的信息,不仅是预期相对文档的特定位置,还有与任何配对标记的距离, 或甚至是所发现的剪辑路径或者要编码的旧形状的曲形描述。文档和其标记并不 需要通到数据库的链接,从而允许与每个典型的元信息使用情况类似而不使用元 信息的使用情况。

标记对人的可见性

如上所述,标记不应干扰页面中的其它绘图或者字符。标记可设计为使用没 有标记影响(在优选实施方案中)或标记影响最小(在次优选的实施方案中)的图形 操作符。在一个实施方案中,标记可仅包含可描画的(stroke-able)线路并且没有可 填充的路径,所以附图本身将不明显,Postscript规则例如将会将这种情况限制为 不超过最终呈现引擎的单个像素、通常在打印行业中是2400/英寸,并且对于多 数喷墨打印机是不大于1/600英寸。

标记也可能在不允许套印能力的情况下被默认成“白色”,或在格式允许套印 能力的情况下(在淡色背景下)被默认成最可能淡的黄色(在考虑文档时,黄色是最 少使用的色彩)。这是旨在消除任何其它色彩平面与黄色平面的相互作用,以尽 可能多地保持背景,或在深色背景的情况下使深黄色仍进行套印。然而,用户或 在第二实施方案中的文档分析程序极有可能将其重新上色成背景色彩。这种类型 下的绘图尺寸也会极小,并且在最坏情况下仅表现为带有中线的非常小的方形。 通常,并不大于句子终点。

当使用对出版物中完全每个绘图的解释(正如通过另一对象隐藏那样有用或 非有用)通过识别并且分析而来发现标记,标记本身并不需要是可见的(暴露)并且 可很好地放在位于如全尺寸的白色方块的任何叠加背景下方的文档中。标记可以 是完全不可见的,但仍可以作为页面描述的一部分。沿Z次序保持先前绘图(色彩 平面沿Z轴叠加在另一色彩平面上方)是用于Postscript PDF、SVG、SWF XPS(这 里仅列举几个)的上色过程的基本原理。

在另一实施方案中,通过构造X轴上的交替位移,每个单元序列可以执行“返 回到0,0”。随后,通过适当修补字体,甚至在嵌入最终的出版物内后改变从描 绘到填充的绘图方法,并且通过修改X位移符号,就可形成类似于可容易地被光 学解码的条形码的模型。

并入虚位文档

在一个实施方案中,标记的消息字形的形状和标记中所嵌入的消息可由提供 作为在出版物内跟踪的文档的子文档(虚位文档)的计算机程序定义。图8a是表示 使用类型3Postscript字体以EPSF(封装PostScript文件)编写的虚位文档的子文档 的实施例。参考编号902至909指定以下内容:

图8a的程序包括计算机可读指令,所述计算机可读指令在执行时产生如图 1b所示带有两个标记104和106的虚位文档。在图8a中,904包括用于绘制底部 左侧的标记106的指令,并且905包括用于绘制顶部右侧的标记104的指令。904 所绘制的标记包括消息HY009,并且905所绘制的标记包括消息HY009T,字母 T指定在此实施方案中的TOP。本文的实施例所产生的虚位文档是Adobe EPSF, 但也可为采用以相同方式设计的真实类型字体或任何类似格式的剪贴部分,

在一个实施方案中,映射表是用来将字形映射到文本中的常规字符。例如, 如图8a中906处所示,字形104和106映射到空格和制表符,其中在EPSF中, ()指定空格并且(/011)指定制表。这有助于避免在过程中替换某处字形的情况下发 生内容更改。空格和制表字符只要求绘图机制偏移到另一位置上,而不通过添加 新的字符更改文档内容。这种情况可能非预期地发生,因为出版软件有时可以替 换字体,从而导致一些字体消失。此行动的影响被认为是对文档的主要修改,从 而导致表示文档已被篡改。如果发生这种事件,那么很有可能的是,用于虚位文 档中的标记的单个字符文本的字体通常将由像“courier”的默认字体替代,并且标 记将失去其目的,直到字体恢复。然而,当字形104和106映射到空格和制表字 符时,标记保持为不可见。

如果出版过程已知是安全到足以涉及给予用于标记的特定字体的名称,那么 引起这种字体替换。在进一步描述的扫描过程完成分析前或过程中,只要恢复过 程允许字体重新嵌入,那么字体替换就是可能的。

图8b是将虚位文档表示为可在HTML中引用的以SVG(可伸缩的矢量图形) 编写的子文档的实施例。参考编号910至915指定以下内容:

图8c是将虚位文档表示为可以用于HTML页面中的CSS(层叠样式表单), 其中字体在远程位点处定义。

这种实施方案可在字体本身并不始终作为文档的一部分嵌入时应用。在这种 情况下,只需在最终对出版物解码前提供带有特定标记的字体。这是其中能够目 的性地替换字体的情况,这不需要任何绘制影响,因为标记中的为文本选择的字 符对于多数已知默认字体而言并不现实,并且只要字体名称是唯一的,替换就容 易通过在呈现时恢复正确字体来逆转。这会允许带有特殊字形的字体来携载巨大 载荷,而不要求文档沿生产链保持巨大载荷。

在一个优选实施方案中,虚位文档中定义的标记104/106可添加到需要被跟 踪的文档100,如图1a至1d所示。这个实施方案应用于带有或不带有文本的任 何性质的文档。然而,对于已知包括可编辑的文本的文档,进一步的方法可应用 于将标记并入文档中。

例如,可能通过对其现有字体字形集合富集而来使用现有字体。需要小心使 用不存在的描述,以便避免最终文档变动。具体来说,文档字体设置可被扫描(例 如,通过与放在PDL解释程序上的钩子相同的过程),以便发现已使用的字体(其 字符中的至少一个用于文本,否则存在字体在出版过程中通过出版软件将合法地 移除的风险)。如果字体呈现未使用的条目(不映射到任何字形的字符,或已知未 在文档中使用的字符),这种字体候选用于富集。多数时候,这很可能成功,因为 每个字体和每个字体的每个字符用在单个文档中的几率很低(存在采用ASCII的 256个字符和Unicode iso-8859-1或UTF8允许的64K字符)。

因此,过程随后查询每个所嵌入的字体,而且搜索并且选择将借用的两个未 使用的条目,并且将像用于标记104/106的字形一样的字形添加到现有字体字形 集合。例如,和是许多文本中很少使用的众所周知的Arial字体中的 Cyrillic部分的一部分。然后,能够使用这些字符将标记104/106包括在字符的字 形部分中。图7a示出展示在借用未使用的条目前字符和其字形表示的映射表,并 且图7b示出展示在借用未使用的条目后字符和其字形表示的映射表。

在另一实施方案,可能使用主体文本中使用的字体的现有字符字形将消息字 形轮廓包括在与字符关联的现有字形内。图7c示出包括在字符“A”的原始字形部 分中的标记“A”的消息字形的实施例。应当注意,消息字形130仅示出为白色, 以使其与字体色彩相反,以便读者可看见它。然而,在实际实现方式中,消息字 形可能没有绘图能力或可将绘制色彩自动默认成针对字符其余部分所原始选择 的色彩,以便仅由用于解释页面描述语言的电子扫描器检测,而不通过人眼或光 学扫描器进行检测。图7d示出将标记并入现有字体路径上以使标记实际是不可 见的实施例。标记可添加到字形内并在现有线路的路径上,以便形成从现有路径 的迂回以将标记包括在字符的字形内。必须在一定程度上小心在现有字形路径下 创建新的路径,或者确保消息字形附加物的边缘将考虑为呈现与字符相同的色 彩,随后,出于安全起见,消息字形附加物能以“填充”操作符结尾。标记可以包 括在字符的字形部分中的任何地方并且包括在文本中的任何字符中,包括点、逗 号等。

在另一实施方案中,所修补的字体可以事先通过包含例如ID或用户名的这 种消息字形进行递送、添加在所有字符上并将其递送给用户以供用作普通字体。 当这种递送需要在合并前完成时,可能需要将消息字形并入原始字形的每个字 符,以便确保至少一个字符将会在解码过程中呈现消息字形。由于这个过程在字 体使用前,因此并不知道哪些字符将被技术者使用用于字体编码机制的大多数 当前格式允许形成这样一种简单方式:通过利用程序方法来使所述格式通用,从 而避免将消息字形附加迂回倍增到每个原始字形所造成的不良影响。

检索过程和虚位文档/标记的检测

当存在检索与出版物内文档有关的信息的理由时,例如,搜索文档或者获得 与文档有关的位置信息等等,出版文件被发送到电子扫描程序模块。扫描目标在 将检索标记中嵌入的消息,以及与其中使用标记(包括放在页面上)语境有关的许 多可能信息。

所有电子出版格式要求呈现器将出版物转换成像素。呈现器嵌入了解释程 序,所述解释程序采用页面描述语言并且以与内部绘图兼容的格式布置绘图。解 释程序可以是简略的(HTML、甚至SVG本身可以是限定符,因为方法非常线性) 或复杂的(允许复杂过程调用的PS、PDF、SWF)。扫描程序模块可以通过与出版 格式兼容的解释程序接收并且处理最终的出版物,但也可以完成它的拦截作用, 即使在打印出版物的情况下也是如此,随后用于打印像PostScript一样的格式的 打印驱动器应当针对字体和关联字形来进行适当字体转换,或仅“打印”出版物到 PostScript解释程序。

本实施方案中,解释程序被配备有采用PostScript样格式的库其它格式的插 件形式的特定钩子。钩子用于捕获标记中的消息以便在字体已转换为轮廓时作为 绘图,或在保持对文档的文本方面的重视时作为字形。当字形或绘图是通过某些 方面识别时,那么钩子捕获当前语境而来获取位置信息。收集信息并且将其传送 到装置外的另一过程以进行处理。传输内容可以是简单的XML文件,其将进入 数据库以允许报告与所提交的出版物内文档有关的操作信息。

扫描程序模块可以采用基于库的拦截程序用于基于语言的呈现器,如 Postscript、PDF等。例如,基于库的拦截程序可以使用以专门用于解释字形绘图 的Postscrip编写的代码库。对于像XPS、SVG或甚至HTML一样的格式,过程 并未使用已暴露的过程完成,而是作为浏览器内呈现引擎的叠瓦部分。在一个实 施方案中,形成特殊设计代码,所述特殊设计代码允许获取呈现信息,并且随后 通过完全相同的过程来检测标记。这可通过插件机制或者通过定制可用的源代码 或者通过重新定向负责绘制字符字形的库(例如,微软WIN32GDI DLL)完成。

在许多情况下,设计过程所用软件允许并入Postscript字体或真实类型字体, 并还允许打印任何出版物或文档。像PostScript一样的页面描述语言和打印机驱 动程序涉及字体描述并且将其转化,如果需要,传送字形而不发生偶然修改。然 后,即使软件不以用于扫描程序的支持格式来保存保存文档,出版物仍可以进行 分析。例如,通过简单地将出版物打印到支持的呈现器、例如PostScript打印机, 消息将从其原来的格式转化并且并入PostScript代码中。它变成了用于支持绘图 的所有格式的通用解决方案。这种过程即使对于XML、SVG XPS和HTML文档 也会是成功的,或者对于PostScript打印机甚至在像在如图8b的SVG描述中使 用本身经编码的标记一样的交叉组合中是成功的,并且对于可与出版技术以及同 样使用计划字体并且允许将其打印出来的CAD或架构绘图关联的环境是成功的。

在基于库的拦截程序中,应当注意,库(实现钩子)可驻留在光栅图像处理器 (Rip)的解释程序部分中以便执行两种呈现:文本呈现(用以检测使用信标作为标准 的特定或富集字体);以及线路呈现或同化的弧形呈现(用以直接检测如图1b所示 标记104的标记中嵌入的信标)。

在文本呈现中,钩子逐渐逐字符地搜索文本字符,以便查找每个字符的字形。 随后,过程扫描与字符关联的每个字形,以便检查能否成功通过逐级并逐步进行 的测试集合,以便实现信标与表示消息的单元要求的最小级别的一致性。如果能 够成功,那么将会报告完成调用时的字符位置以及带有其消息的关联字形。如果 字符已转化成轮廓,那么钩子拦截线路绘制请求并类似地搜索信标模型所用绘 图,随后,转至进行相同检查,看看剩余的位(单元)中是否存在一致性。

一旦识别完整消息,钩子就会获取文档的当前位置、页面尺寸、剪辑路径、 当前色彩等,以便报告结果。

图9示出来自单页出版物的采用XML的示例扫描程序报告。图9是图9a 和9b的叠加。图9a包括跟踪绘图类型文档的结果,并且图9b示出跟踪包括可编 辑的文本的文档的结果。参考编号1001至1004指定以下内容:

当标记包括在字符的字形中时,过程受益于出版物中每个应用处理文本的方 式。文本并非重大元素。它不要求页面内的优化。在一个实施方案中,过程通过 文档以仅仅两个字符使文本负载基本增加。

过程可以嵌入同一计算机中以供本地使用,或者作为其中标记生成并嵌入服 务器和/或客户端机器上的虚位文档中的客户端-服务器架构。如果过程中的扫描 部分在中心服务器上完成,那么标记可由唯一id构成。

图10是示出一种用于扫描出版物的方法的流程图。所述方法在步骤150通 过将出版物发送到呈现器开始。步骤152和154可以用于找出包括了可编辑的文 本的文档中的标记。具体地说,步骤152包括跟踪出版物的文本,以便搜索字符 字形中的标记。如果找到信标,那么在步骤154报告字符位置。在步骤156,检 查消息的完整性。

步骤158和160可以用于找出文档中的标记,所述标记具有绘图性质,例如, 标志、轮廓、图片等等。在步骤158,过程逐步跟踪绘图,以便检查标记(参见图 1a至1d)。当找到信标时,在步骤160报告信标的第一线路位置。过程随后转至 步骤156。步骤158至160可以在步骤152至154前完成或与步骤152至154并 行完成。

如果验证消息的完整性,那么过程转至步骤162,以便收集与文档有关的语 境信息,包括位置信息、尺寸、x/y比率、色彩、字体、页面尺寸、页面标签等 等。如果并未验证消息的完整性,那么过程仅仅转至在步骤164跟踪下一标记。 在步骤162,过程转至步骤166以便递送信息。

图11是示出一种用于跟踪出版物内电子文档的通用方法的流程图。在步骤 200,接收消息以与电子文档关联。步骤202包括将消息的二进制表示编码在至 少一个轮廓的字形中,包括在至少一个轮廓的字形内对二进制表示的每个位绘制 特定几何形状。步骤204包括将标记添加在电子文档内的特定地方,以便形成可 跟踪的文档,所述可跟踪的文档具有消息作为出版物内唯一标识。

图12是根据实现方式中的第一实施方案的一种用于生成出版物内可跟踪的 文档的示例系统的方框图。如图12所示,系统250包括:第一输入端252,所述 第一输入端252用于接收需要被跟踪的文档;以及第二输入端254,所述第二输 入端254用于接收唯一消息。唯一消息可由用户输入,可由计算机来生成(例如, 消息可像URN一样随机化或生成)和/或被存储在存储库中,或可基于文档本身内 容生成。标记生成模块256接收消息并且生成标记,所述标记已在其字形中对表 示消息的二进制格式的几何形状进行编码。标记生成模块所产生的标记被发送到 文档跟踪模块258以添加到需要被跟踪的文档。在一个实施方案中,文档跟踪模 块258可将标记提供在虚位文档中,所述虚位文档适配用于在电子文档上展开, 以便生成可跟踪的文档。

图13是根据第一实施方案的示出一种用于跟踪出版物内电子文档的方法的 流程图。所述方法在步骤270通过接收唯一消息以与电子文档关联开始。步骤272 包括生成虚位文档,所述虚位文档包括提供在所述虚位文档内的特定位置的至少 一个标记。步骤274包括在至少一个标记的字形中对唯一消息的二进制表示进行 编码,包括在至少一个标记的字形内对二进制表示的每个位绘制特定几何形状。 步骤276包括将虚位文档添加到电子文档,以便形成可跟踪的文档,所述可跟踪 的文档具有消息作为出版物内唯一标识。

图14是根据实现方式中的第二实施方案的一种用于生成出版物中可跟踪的 文档的示例系统的方框图。如图14所示,系统300接收输入,所述输入即为出 版物内需要被跟踪的文档302。系统300可为自动系统,其不要求用户介入进行 消息输入或将虚位文档并入文档302上。文档分析程序304接收文档302并且对 其进行分析,以便提取与文档有关的文档情报信息,包括但不限于:文档尺寸、 作者、剪辑路径、生产信息、页边等等。

随后,将信息发送到消息生成程序306。消息生成程序306生成消息,包括 文档分析程序304所接收的信息中的一些或者全部。随后,将由此所生成的消息 发送到标记生成模块308以便生成标记,所述标记已在其字形中对表示消息的二 进制格式的几何形状进行编码。文档跟踪模块310接收文档302并将标记生成模 块308所生成的标记并入文档中的特定地方,以便形成这种文档:具有消息作为 出版物内唯一标识以及另外嵌入的几何形状和文档情报,以便产生可跟踪的文 档。

图15是根据第二实施方案的示出一种用于跟踪电子文档的方法的流程图。 方法在步骤310通过接收电子文档开始。步骤312包括分析文档并且收集与文档 有关的文档情报信息。步骤314包括基于所收集的文档情报信息生成消息,所述 消息包括文档情报信息的至少一部分。步骤314包括基于所收集的文档情报信息 生成消息,所述消息包括文档情报信息的至少一部分。步骤316包括生成标记, 包括在标记的字形中对唯一消息的二进制表示进行编码,其中包括在标记的字形 内对二进制表示的每个位绘制特定几何形状。步骤318包括将标记添加到电子文 档、位于文档中的特定地方,以便形成可跟踪的文档,所述可跟踪的文档具有消 息作为出版物内唯一标识。

图16是根据另一实施方案的一种用于生成虚位文档的示例系统的方框图。 如图16所示,系统350包括输入端652,所述输入端652用于接收消息。消息可 由用户输入、可由自动消息生成程序(例如,随机生成程序)生成和/或被存储在 数据库中。标记生成模块354接收消息并且生成标记,所述标记已在其字形中对 表示消息的二进制格式的几何形状进行编码。标记生成模块所生成的标记被发送 到虚位文档生成模块356。虚位文档生成模块356将标记并入虚位文档中、位于 虚位文档边界和/或中心内的特定地方。在一个实施方案中,虚位文档适配用于在 电子文档上覆盖和/或展开,以便形成可跟踪的文档,所述可跟踪的文档具有消息 作为嵌入标记内的标识。

图17是一种用于形成虚位文档以供用于跟踪电子文档的方法的流程图。方 法在步骤360通过接收消息开始。步骤362包括在标记的字形中对消息的二进制 表示进行编码,包括在标记的字形内对二进制表示的每个位绘制特定几何形状。 步骤364包括生成虚位文档,所述虚位文档具有相对虚位文档边界和/或中心提供 在特定位置的标记。由此所生成的虚位文档可以被存储在存储器中以供稍后使 用。虚位文档可与电子文档重叠和/或在电子文档上展开,以便形成可跟踪的文档。

实施方案可以实现作为与计算机系统一起使用的计算机程序产品。这些实现 方式可以包括固定在如计算机可读媒介(例如,磁盘、CD-ROM、ROM或固定磁 盘)的有形媒介上或者经由调制解调器或其它接口装置(如通过媒介连接到网络的 通信适配器)可发送到计算机系统的一系列的计算机指令。媒介可为有形媒介(例 如,光学通信线路或者电气通信线路),或为通过无线技术来实现的媒介(例如, 微波、红外或者其它传输技术)。一系列的计算机指令使本文之前所述功能中的全 部或者部分实现。本领域中技术人员应当了解,能以多个编程语言编写这样的计 算机指令,以与许多计算机架构或操作系统一起使用。此外,这些指令可以被存 储在如半导体存储装置、磁学存储装置、光学存储装置或者其它存储装置等任何 存储装置中,并且可以使用如光学、红外、微波或者其它传输技术的任何通信技 术进行传输。预期的是,这样的计算机程序产品可被分发作为附有打印文档或电 子文档(例如,压缩打包软件)的可移除的媒介,预装到计算机系统(例如,在系统 ROM或固定磁盘上),或者通过网络(例如,因特网或万维网)从服务器进行分发。 当然,本发明的一些实施方案能以软件(例如,计算机程序产品)和硬件两者组合 实现。本发明的其它实施方案可实现为全部硬件或者全部软件(例如,计算机程序 产品)。

尽管优选实施方案已在上文中描述并在附图中示出,但本领域技术人员将会 清楚,可以在不与本公开背离的情况下做出修改。这些修改被认为是本公开的范 围内包括的可能变体。例如,实施方案还可用于标记电子出版物内视频文件。在 这种情况中,至少能以视频描述语言矢量形状(特定或甚至是关于图8b所描述的 SVG)插入标记。标记可以通过广播所用最终呈现器来解码。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号