首页> 中国专利> 通过虚拟文档架构来促进协同编辑和承担责任的自动出版系统

通过虚拟文档架构来促进协同编辑和承担责任的自动出版系统

摘要

本发明的系统能够自动出版金融、法律、和政府文档、以及任何其它出版物,所述其它出版物被结构化并需要遵照公司规定或外部规定,出版物还可共享内容元素。本发明使用户能够在熟悉的无休日环境,即互联网中,进行控制。由于在互联网和内网上工作的虚拟文档架构和性能因素,该系统利于协同工作和跟踪责任。支持自动出版的关键概念是通过更好的内容管理来控制进度安排和成本。本发明把文档作为小的、可重复使用的成分的文档内容,直至小到段落和表单元级别,来进行处理。该界面通过自动支持来帮助用户,从而通过这些版本受控的成分来汇编文档。该系统把与每一成分一起存储的上下文和过滤标准应用于定位内容片段,或把内容片段应用于现行文档。本发明的系统可应用结构规则和内容要求来保证与规章要求和公司业务规则的一致性。该系统中的有效虚拟文档一直包含全部成分元素的现行版本。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-23

    未缴年费专利权终止 IPC(主分类):G06Q10/10 授权公告日:20170308 终止日期:20190708 申请日:20040708

    专利权的终止

  • 2017-03-08

    授权

    授权

  • 2007-04-18

    实质审查的生效

    实质审查的生效

  • 2007-02-21

    公开

    公开

说明书

技术领域

本发明涉及对文档的协同准备、写作、和出版,所述文档形成了一组紧密相关并且以相似方式构造的、可共享内容元素的文档组。所述文档组/多个组需要进行结构和内容控制,以便符合业务规则和/或规章要求,并且同时可要求以不同的格式和媒介来进行表现。该文档出版工作对时间和成本是敏感的。

背景技术

迄今为止,文档制备的普遍模式为(1)连续模式的制造和(2)依赖于用于控制出版进度表的数据源可用性。该过程还需要把客户机数据从他们诸如Word之类的制备系统传递到用于排版和准备印刷的另一制造系统。在该过程中,印刷商可能有印刷错误(PE,不能对客户计费),所述印刷错误在计费过程中必须和作者的修改(AA,可对客户计费)区分开。

当一组文档共享文本或其它元素时,针对元素的任何改变必须被推广到整组文档,该整组文档通常具有不同的出版日期。一般的手工解决方案是把通知发给负责各个需要改变的文档的编者。该方法不能保证所经时间(因为在出版日期之间的时间内可能出现其它改变),并且不能进行改变处理本身。

诸如样板资料库之类的解决该问题的老电子方法已经引入到早先的专有字处理系统,通常把样板元素输入到文档自身中。之后,更普遍的方法是使用作为ISO国际标准的标准通用标记语言(SGML)。SGML公布了一个标准,即,一种开放方法,通过写入一组规则的来为一组文档加上标记,所述文档共享相同的通用结构和内容类型。SGML引入了一种存储样板或保持文本并通过引用将样板或文本插入的方法,该样板可驻留在文档自身之外。然而,该引用仍然被嵌入在文档流中,并且该文档必须识别样板引用源。但是没有有效方法来处理片段出版。

后来采用的SGML是可扩展标记语言(XML),也是一种描述文档结构和内容元素的方法,其已在万维网(WWW)上被接受。类似于SGML的XML有效地把结构和内容与虚拟格式设置分开。因此,对发明人的挑战是开发一种机制,使得有效地结合共享元素而不将它们嵌入到流文档中。发明人使用XML来解决加强结构和描述内容的问题,并且通过使用XML元素指向不包含所述元素的内容来实现这样的处理:进一步把结构从内容中分离出来。这样的结果就是虚拟文档

发明内容

本发明的目的在于提供一种系统,该系统把文档作为小的可重复使用的共享成分,小到段落和表单元级别,来进行处理。在该系统中,用户界面允许用户通过自动支持来从版本受控的成分生成出版物。

与传统的出版方法相比,本发明具有很多优点。例如,因为本发明提供的精确性和一致性使错误更少,所以,其缩短了出版时间。通过对全部改变进行记录和文件编制,本发明提供了责任承担性。其还解决了如何将文档内容的责任分开的问题,诸如把管理当局对数量的控制的责任和法律部门需要对公布事项控制之间的责任分开。

另外,可在无时间延迟的情况下进行任意次数的校对和作者修改。可以电子方式执行注释和校样发布。该系统还以能够引用全部系统对象的统一方案来提供完全的文本搜索功能。该系统包括能够防止与其它文档共享的成分发生改变的工具。该系统提供了灵活的进度安排,还允许用户提前进行工作而不会使版本混淆。通过资料库自动进行全局改变。与由于管理员的能力有限而设立受限制的工作组的系统管理相比,本发明具有更强的控制能力。

上述系统可适用于各种情况。例如:

●当一组文档共享巨量内容时——与仅处理大块内容的系统相比,通过在段落级别管理文档成分,可以以使得效率和灵活性最大化的粒度(granularity)来在文档间共享成分。

●当共享成分需要修订时——仅需要进行一次改变。掌握了业务规则和规章规定的成分属性控制在哪些文档中出现业务规则和规章规定。

●当文档必须符合一个或多个规章环境时——该系统可存储每一环境的结构大纲和成分版本。

●当协同进行文档制备时——在诸如教材出版之类的涉及多个作者的情况下,作者们可打开同一部书或一本书的一部分,以实时进行协同工作。在企业中,由不同的工作组制备文档的各部分。

●当把外部公司提供的数据汇编为本公司的文档时——较大系统中的转包部分的制作者可以提供并拥有文档的一部分,并且每一供稿人可同时对该文档展开工作(而不是把若干片段汇编为完全的文档)。

●当文档必须无延迟地以多种语言出现时——该系统具有强健的翻译管理系统,当出现改变时,其保证通过电子方式通知译者来翻译修订版本,并且每一段落均被绑定到该文档的其它语言版本和地方版本。

●当审阅过程涉及到一些外部供稿人时——来自审阅者的注释可被以电子方式提交并且进入到跟踪系统,跟踪系统把小到成分级别的注释正式通知编者,并且审阅者可在网络上访问完全排版的校样。

●当需要防止内容被未授权地修订时——该系统可建立小到段落级别的内容所有权。

●当一家公司具有需要针对一系列型号进行文档编制时——服务和用户手册针对多个型号具有相同点和不同点。

●当公司希望出版定制的文档而不想打破它们的预算时——该系统可容易地把链接集成到外部数据资料库以进行定制,并且该系统可一经请求立刻快速地并自动地生产高质量印刷母版。

●当文档的最终期限很紧并且必须同时以多种格式出版时——该系统可一经请求立刻传送新的、完全排版的校样。该系统还以用户的业务需要所要求的格式来同时传送校样/母版。

发现它们自己正在面对这些情况的行业包括金融和保险服务、主要的制造业、教材和刊物出版、管理机构、国家和跨过机构、法律出版、航空制造、国防工业、诸如能源、制药、和食品供应商之类的规定制造者、和软件公司。

如本发明所述,一份出版物是一份文档,(1)因为该文档的主题、读者、目的等不同,所以客户机将其看作与其它可出版文档不同的文档;(2)该文档必须符合一家企业的公司一致性和业务规则;(3)可以以诸如印刷或互联网文件之类的传统发布形式来出版该文档;以及(4)该文档可以以新的出版形式周期性地再生产。通过该定义,一份出版物具有语言特性而且是唯一的语言特性(多语言出版物具有唯一的一组语言)。任何出版物必须符合其出版物类型、针对出版物内容的普遍规则的形式定义、它们的次序、和亲/子关系。一组相关出版物称作一个出版物组,所述相关出版物共享一定量的内容并且通过一组分离的出版物类型来管理。例如,在金融服务业中,募股章程可具有一种出版物类型,股东报告也可具有其单独的出版物类型,但是,因为它们可共享财务报表、公布事项、有价证券管理人简历等,所以,它们可以是相同的出版物组-股东通信-的一部分。由于本发明通过使用指向依次指向内容的结构元素的指针来创建虚拟文档,所以,不同结构类型的文档可共享相同的内容。

因为本发明考虑的是把出版物雾化(atomization),所以,如图14所示,负责文档的不同部分的工作组可同时针对一份虚拟文档展开工作。在编辑文档本身之前,可创建文档内容。在连续模式的制造过程中,在进度表中有一些频繁点,在所述进度表中合作者必须被批准并且进行工作组交接。在本发明的实施例中,当文档的成分被最终定稿时,合作者可批准他们所负责的文档的成分,并且通过电子邮件通知团队成员。例如,大部分金融业公司把表列数据分派给产品管理组,把对所需的语言和公布事项进行检验的工作分派给法律组,并且把对投资政策和目标的描述工作分派给市场部门和/或有价证券管理者。可使用该系统的各种过滤功能在任何时间创建这些不同类型的内容,并且可将它们预分配给一份或多份文档。因此,该系统允许对文档内容进行分散的或协同的负责,而完全不用在以实体方式或以电子方式把它们从一组交给另一组。

图26a、26b、和26c描述了已有技术的方法和根据本发明的方法的一个实施例之间的比较。从已有技术的方法中所示的文档制备过程的复杂性明显可见,申请人认识到了诸如图26c中所示的更简化的文档制备过程将是更有利的。在处理一个客户需求时,申请人也认识到:(a)金融业和其他客户的文档是由跨越文档组而全局使用的成分构成的,是由特定子集或仅由一份文档组成;(b)对共享成分进行更新是一个耗时而且通常不准确的处理;(c)客户文档被限制为遵照法律、规章、和公司市场要求;(d)当没有按时出版时客户会进行严厉处罚,当不包括所需材料和法律公布事项时甚至会有更严厉的处罚;(e)数据源可用性时线和资金会计、法律事务、或其它第三方编辑供稿都会妨碍进度;(f)在将文档发送到排版服务提供商之前,公司工作员已经在桌面环境下制备好文档;(g)由于重要材料被服务提供商出于备用目的键入,所以,尽管客户文档已经在没有错误的情况下被提交,但是可能在正常材料的基础上出现错误;(h)在可以开始对页面进行排版或改变之前,印刷服务提供商需要调换材料,并且需要的调转(turnaround)延迟从48小时变为8小时;以及(i)用于生产校样、之后进行出版的正常过程的一系列特性带来了延时,这使得进度安排变得更差。而且,随着印刷时限越来越近,后面的因素变得尤其重要。

另外,金融业被要求把他们的文档以电子方式按规定格式提交给政府调节部门,并且该提交工作必须和印刷准备同时进行;由于在批准印刷和服务提供商交付遵照规章的已知如EDGAR II之类的文件格式之间总是存在延时,所以该情况是出现进度安排问题的另一原因。产生EDGAR II文件的过程并不总是得自于与印刷产生的数据源相同的数据源。

通过彻底改变以下工作流程和处理,本发明解决了上述问题,所述工作流程包括文档制备、审阅、编辑、跟踪改变、聚集注释、产生校样和加黑线的(backlined)校样、计费、和创建文档的印刷和辅助文件格式(诸如EDGAR II)。

在本发明的实施例中,该系统通过以XML进行编码来实现一些重要功能。通过使用该开放标记标准,能够进行从单一数据源到不同的数据/文件格式的自动同时转换,而且已知的转换如视图转换。例如,只要金融业客户请求校样,其就可接收以PDF格式、EDGAR II、和HTML写成的校样。XML还具有过滤标准的功能,从而评估出版物中所包括的候选成分。

在本发明的实施例中,该系统引入了一种编辑结构化文档的新方法,该结构化文档保存了结构信息,但是仍然允许正常的点和点击(point-and-click)编辑。图20至25中所示和详细说明描述了结构栏(structure bar)概念。

在本发明的实施例中,该系统是由客户机激活并且是由客户机指挥的。用户进行实时操作意味着材料从未通过实体形式或传真形式发送到印刷公司,并且在客户等待印刷商传送校样时没有“调转”时间间隙。客户机可以在任何时刻生成文档的现行状态,而不会增加成本并且能够具有最小延迟。客户能够完全控制他们的作品和所作处理。第三方服务提供商不会接触到成分或文档数据,而仅仅客户可以接触。因为从未在制造系统之间交换过数据,所以也就不会出现PE(印刷商错误)的概念。

通过使用内置在客户机界面(命令层)(图1)中的许可系统,客户通过设置详细的用户许可列表来控制对该系统的访问。这些许可对用户界面的众多方面进行控制,所述方面包括显示给观者的系统选项。无论在客户侧还是服务提供商侧,未授权用户不能对成分和文档数据进行读取或其它访问。通过防止如同在制造系统之间传送的传统模型中发生的那种拦截,客户工作的安全性得到保证。该系统既是内容源,又是包括排版页面在内的全部输出格式的生产者,该系统对于出版物来说是一种无缝制造系统。

在本发明的一个实施例中,该系统在互联网上的万维网环境中工作,或者通过使用相同的协议在专用内网上工作。对于客户来说,成本优势在于,不需要购买设备或软件,而且大部分客户“无休地”进行互联网访问。客户机通过Web与本发明及其服务器实时交互。只要具有标准浏览器和与互联网的连接,用户就可在白天黑夜的任何时间或任何时区时间从任何地点访问该系统。该系统并不必须依赖LAN连接,因此就不依赖于地点或设备。

在本发明的实施例中,该系统存储了全部客户机文档和他们的出版进度安排的profile表。这些表也存储了客户机文档的主题的其它方面,诸如一份文档(多级)中包含的产品、服务、和/或主题。例如,很多金融业公司把共同基金结合到募股章程中,该募股章程覆盖了某种基金类型(股本、抵押、差额、资金市场等)或产品线。这些公司还为他们基金的不同的股份类别-零售、机构、私人管理等印刷了不同的募股章程。这种profile表稍后作为业务目的定义来进行讨论并且如图6和7中所示,这种profile表是把特定成分应用于某一文档的过滤系统的一部分。所述profile表可被重构以符合用户需要,并且数据是可修订的。用于评估包括在文档中的成分的“业务规则”也是可重构的。

即使包括表和附注在内的全部成分仅包含在一份文档中,这些成分也不依赖于特定文档而存在。多个成分可被应用于任何文档,如果进行更新,则(根据更新的成分的有效期和到期日)只要更新的成分出现在文档中,就将自动应用更新的内容。

根据文本不同的语言特性、符合不同规章环境所写成的匹配标题、和在不同的市场设定下的产品项和ID,该系统识别出成分的等价物的概念。因为必须要适合于不同国家和地区的要求,所以等价物是自动进行自然语言翻译和规章编排的基础。

表和脚注由专门的管理模块进行处理。该子系统允许当数据变得可用时创建表,并且表一旦完成,就允许将表自动应用于适当的现行版本。在开始将表应用于文档之前,所述表已被预先创建。脚注也被创建,并且被保持为独立的成分;专用的用户界面(UI)允许脚注被容易地应用于整个表,或者应用于单个表单元和段落。

在某个成分存在期间,在全部文档中跟踪所述成分的修订历史。修订日志显示每一次修订的记录,用户可将说明性的意见附在该修订日志上;每一份记录都列出了修订的数据,用户进行的修订可覆盖用户从一文档访问成分的所述文档的日期、进行修订的校样号、出版日期是否适用、和对成分文本进行加黑线显示。每当用户产生一个新校样时,文档的校样就被加黑线。(加黑线是一个技术术语,表示用于把可审阅的校样加上标记,以显示在哪里从较早的状态出现修订、删除和添加)。

通过使专家、内部和外部的客户组织合作,该系统允许进行电子形式的审阅和注释。审阅者对所产生的校样的专门显示版本进行注释,它们可把意见附在文档的任何成分上。这些意见将作为需要解决的问题而被跟踪。

尝试进行自动视图转换以请求产生校样,或出版文档。诸如EDGAR II之类的格式是来自相同的虚拟文档的源,所述虚拟文档产生了排版的校样。哪种格式要被生产、和在过程中的哪些点上进行生产是可被配置的。

某些动作触发给用户的自动通知,所述用户具有接收全部这种动作通知的许可。从系统到用户的自动通知包括:PDF校样可用,开始对文档进行新的编辑,已经上载了表,并且已经完成了文档的出版。通过专用的标志,在显示成分时通知对成分所进行的改变(修订日志将证明所述改变)。

附图说明

图1描述了根据本发明实施例的本系统总的架构和其通过客户机界面(命令层)到用户客户机的处理线路。

图2描述了各种通信协议和根据本发明实施例通过客户机界面(命令层)的全部处理线路。

图3是根据本发明实施例的HTTP通信流程的流程图。

图4是根据本发明实施例的SOAP(简单对象访问协议)通信流程的流程图。

图5描述了根据本发明实施例的支持虚拟文档的架构和虚拟文档如何构成。

图6描述了根据本发明实施例对复杂业务对象进行动态创建的业务对象管理的架构。

图7是示出了根据本发明实施例的业务对象的示例的流程图。

图8描述了根据本发明实施例在文档中的任一点构造文档环境值的环境管理系统的架构。

图9是示出根据本发明实施例由文档管理器子系统构造和更新文档环境的流程图。

图10描述了根据本发明的实施例,当自动处置器(AutoPopulator)在没有参考另一出版物的元素图解的情况下汇编第一版本出版物时,自动处置器的架构和关系。

图11是根据本发明的实施例,仅通过使用DTD和规则,请求创建档案库中不具有出版版本的文档的流程图。

图12描述了根据本发明的实施例,当基于基础版本的元素图解汇编新版本时,自动处置器的架构和关系。

图13是根据本发明的实施例,启用已出版和已存档的文档的新版本、基础版本的流程图。

图14是根据本发明的实施例,多个工作组根据它们的负责部分对同一文档展开工作的示图。

图15描述了根据本发明的实施例,当元素被调整时元素和成分之间的关系。

图16是示出调整成分的处理的流程图。

图17是根据本发明的实施例,请求产生校样、并且系统将实体输出文档布置到专门位置的流程图。

图18描述了根据本发明的实施例的输出系统的总的架构,在该输出系统中,转换引擎从输出格式目的地检索输出规范。

图19是根据本发明的实施例,当文档状态变为“出版”时的动作的流程图。

图20描述了根据本发明的实施例,用于编辑现行版本的用户界面屏幕,示出了混合树状导航窗口、结构栏、和WYSIWYG编辑窗口。

图21是根据本发明实施例的混合树状界面的更接近的示图。

图22是根据本发明的实施例示出四个流程状况的混合树状用户动作示图。

图23是根据本发明实施例的结构栏和编者窗格界面的特写。

图24是根据本发明的实施例,能够在编者面板中进行的各种用户动作的流程图。

图25是根据本发明的实施例的现行版本调整次序的流程图。

图26a、26b和26c描述了已有技术的方法和本发明的实施例之间的比较。

图27、28、和29描述了根据本发明实施例,当从版本管理员的角度看时供稿的作者/编者的系统操作。

具体实施方式

本发明汇编并产生了文档的虚拟版本,而非具有嵌入内容的系列文档文件。一份文档是意图与一组特定接收者收发一组信息的内容结合,无论所述接收者在组织内部还是组织外部。在该定义中,文档不是过渡性的,即,不像诸如信件和备忘录之类那样在同事之间日复一日的通信。根据本发明实施例的文档是以能够进行更广泛分布的某种格式化的布局或格式呈现的。文档可包含,但不限于,加标题和其它标识符、解释的文本、图示、图表、表、诸如内容和索引之类的内部引用、和诸如脚注或URL链接之类的其它引用。

该系统利用结构化文档的概念。除了文字内容或含义之外,可根据结构化文档成分的次序、层次关系、和类型及元素描述结构化文档。根据众多业务和规章文档中有两个特性,可使得所述业务和规章文档作为优秀的候选者用于结构化处理,所述两个特性为:(1)诸如金融和法律文档之类的众多文档具有委托的内容,和(2)大部分商业和政府文档都遵照一致的样板或一组样板。因此,无论基础标准是正式表示的还是传统实践所隐含的,一组有顺序的文档和命名的内容元素可被开发并遵照基础标准。可通过以下规则来构造新的文档和成分。

在本发明的实施例中,整个文档组的文本和其它成分被打散为出版物组中的小的、离散的成分。基本上,每一标题、小标题、段落、表单元、脚注、列表项等都被视为具有其自身唯一ID的内容成分,并且内容成分可被文档元素引用。在XML中,一个元素是文档数据中被区分开的一部分,其具有发表的名称、内容类型、和文档中的位置。元素可具有亲(parent)元素,并且可包含其它元素(子元素)。元素还可包含文本数据、其它表示法中的实体(诸如例图)、和少许其它数据类型。

在文档中,这种低等级元素是较高等级成分的子代,所述较高等级成分提供具有内容的文本元素。可通过诸如“风险因素”或“偶然负债”之类的描述性标记来识别这些较高等级成分。从文档根元素自身开始,元素的上下文是分级的。(根元素是文档中的第一个元素,仅包含元素,并且是其它全部元素的亲元素。)元素的上下文是元数据的一部分,并且对很多处理来说都是完整的,所述处理诸如产生文档、和缩窄文本搜索的范围。(元数据是除了其内容之外的与元素、文档等相关的数据的结合,诸如时间戳、作者、上次更新、出版物类型、上下文显示名称等。)元素具有用于成分特性的规则或资格,用于在资料库中定位特定成分,例如,语言必须等于“西班牙语”。

本发明把作为离散、独立的记录的内容成分存储在文档独立表中。出版物的一个版本仅以虚拟感观存在于其元素的列表中。每一个元素指向成分ID,而不是直接包含内容。以此方式,一段文本可被位于不同出版物中的不同元素共享。该元素地图可被用于使新的出版物以一个现有出版物为基础。

该系统通过保持版本受控的成分的内容资料库来管理内容。一个成分是对有特性的内容的选择,所述特性是键值对,并且可以以有意义的方式描述成分。成分的类型可包括,但不限于,文本、脚注文本、表、指向外部数据反馈的指针、数字、图形、文档片段、内容组等。每一成分是内容资料库中单独的实体。可在多个出版物之间共享成分。新的成分可被加到资料库中,并且可基于现有成分产生新的成分。为了使存储的数据量保持为最小,该系统可在整个资料库中检索复制的成分。可使用系统统一的搜索工具来查找成分,所述搜索工具可涉及全部系统对象,如同具有完全文本搜索功能的查询系统那样工作。可在编辑现行版本的同时执行搜索,而且是独立于出版物和版本执行搜索。成分还携带一些值,针对:当成分有效时,即,当成分第一次可被用在任一现行版本中时;并且当它们到期时或如果它们到期,即,不再是任一现行版本的一部分时。针对每一成分创建审计追踪,所述成分示出了创建日期、创建人、更新日期、更新用户、修订理由、和加黑线的改变。

当存在多个版本的特定内容时,可构造内容组;在自然语言、国家特定措辞、和诸如针对不同的市场划分或覆盖不同产品模型之类的针对规章或业务目的的措辞方面,多个版本可表现出差异。所述多个版本以某种方式相关。例如,每一成分可覆盖相同的主题区域,但是可以以不同的语言写成,或者可覆盖不同区域的法律。如同任何其它成分那样,内容组可具有其自身的特性,但是其不具有自身的内容。相反,内容组引用若干其它成分。根据对其特性和环境的系统评估,内容组将会提供其成分之一的内容。成分版本彼此之间可能强相关也可能弱相关,这被表示为对内容组的主要构件有强依赖性或弱依赖性。

脚注和表构成了它们自身的一组资料库。列表事项被维持为一个依赖于文档的资料库,并且可独立于现行版本来被校对和编辑。可将资料库中的表应用于任一文档,而且该系统使用达成一致的协议来接受必须从第三方获得的单一命令表数据,所述协议识别目标表类型和目标文档。该协议还允许脚注在数据反馈中被分配。在其它事情中,该系统可用于维持公布事项和脚注的资料库。用户界面能够容易地把一个脚注分配给全部表或分配给单独的表单元。诸如清单数据之类的其它离散的资料库可被加到系统中以符合客户需要。

该系统可被广泛配置用于专门的调配。根据用户组织的需要,调配是对由对象表、特性、规则、和例程支持的系统的专门配置。系统的某些表现可被配置作为调配处理的一部分。

明确的是,顾客业务规则和数据可能在出版物间带来不同。出于部门线、产品线、目标市场、国家边界、擅长的区域、和类似考虑,组织可为出版物划分和建立所有权和责任。该数据可使得某些写作处理自动化,但是,为了能够这么做,所述数据需要以结构格式而被捕获。咨询这种结构数据的操作可被用于以下任务,如:确定出版物的主旨、产生文本并针对URL和活链接产生插入点、确定包括在一个版本中的候选成分的合适程度、和分解变量。为了避免必须为每一客户写常规程序,该系统具有建立该结构数据集合的一般方法;该数据集合可被查询,并且可被集成到该系统的众多基本功能中。在调配时也可配置该方法,并且该方法具有更新数据的用户界面(UI)。

该系统可利用作为业务对象配置的客户专用数据。业务对象必须符合业务对象定义之一,针对每一遵循形式框架的调配建立所述业务对象定义。该定义包括对象类型的名称和一组特性,所述特性可影响文档内容,或被用于文本产生和变量分解。

在本发明的实施例中,每一出版物具有一个环境,或者具有业务对象和出版物属性与该文档的关联。该环境可在从出版物组到校样、小到成分级别的众多级别来进行关联。该环境是子对象从亲对象继承的值的累积。例如,如果现行版本不具有该版本级别的特定环境,则其可从其亲代,即出版物继承,或者可从后面的亲代,即出版物组继承。

文档对象通常与使用规则相关联,使用规则评估环境变量以便采取动作,诸如确定哪一个版本成分包括在翻译文档中。规则是在本地环境中引用业务对象和属性值的陈述。它们由前提侧和后果侧构成。前提侧陈述必须评估为“真”、或者满足后果动作发生的值或比较陈述的条件。后果侧描述了带来不同评估结果的动作。例如,在翻译文档的情况下,出版物将具有用于语言的值,由现行版本继承,以设置所有成分必须匹配的语言特性。

该系统不把文档存储为文本流,但是存储为指向结构化文档略图的元素的指针。元素依次指向特定成分。该组织促进了非重复存储,并且更重要的是,该组织可完成每一出版物的自动更新,自动更新通过成分的元素指向修订的成分。元素和成分二者都具有(分别)包含一些值的属性和特性,所述值可根据客户机特定的业务规则而被映射到特定出版物/现行版本特性。

出版物是全部版本的亲代,并且通过结构化文档定义进行管理,结构化文档定义在本发明的实施例中被称作出版物类型。在存储器中示出出版物类型作为文档结构(图5);该文档结构在构造版本的过程中引导自动处置器(图11)。

将元素汇编为可修订状态下的出版物的现行版本,所述元素引用资料库中存储的成分。可由驻留在出版档案库中的现有版本创建新的现行版本。

每当用户打开一个现行版本时,该系统收集元素的列表,并且通过处在现行状态下的成分来进行收集。该版本被飞速(on the fly)汇编,而从未被存储以编辑为实体流。仅当该版本已被处理进行外部发布时,该版本才作为连续实体存在,例如,作为校样、EDGAR II文件、web记入、出版的文档的档案库等。

当用户开始创建现有出版物的新版本时(图13),该系统可检索最后的版本,现在考虑用基础版本来建立新版本。如果从基础版本被存档开始更新了任一成分,则最新的成分通过引用而被结合。被称作文档管理器的系统的该部分把文档汇编的工作委派给自动处置器,该自动处置器重新评估出版物略图中的每一元素,以保证其仍然符合现行业务规则和出版环境(图13)。如果业务对象和规则已经改变,则特定的元素可以不再属于该出版物。该系统以软包含状态(softinclude status)包括以前有效的元素,而非将该元素省略,软包含状态表示一个错误状态。全部软包含状态必须是以下状态之一,(a)由用户从该版本中删除,以及(b)具有在适当的级别改变的使用规则,以便在能够出版该版本之前确认其合适程度。

在使以前的法律元素无效的改变使用规则的例子是,当金融业公司将以前单一的募股章程分为单独的零售和机构出版物时出现的情况。将会更新业务对象以反映该改变,因此,专门针对机构投资者的语言将保证不再包括在零售出版物中。对于零售募股章程,该系统将不再选择具有“机构”特性的成分。

在该汇编处理中,该系统评估元素候选者以进行包含。候选元素是这样的元素,其完全或部分满足在具体文档的特定位置上包含元素的请求。从最特殊到较一般来对候选者进行评估,即,从满足最多特性规则匹配到满足最少特性规则进行匹配。可能必需匹配某些成分特性,诸如语言,并且导致如果未发现匹配则不返回候选者。

文档环境系统基于多个规则控制文档汇编。这些规则可包括:

a)元素的上下文,其可在完全合格的项目(其全部亲元素,从根元素开始)中、或以相关方式(向上引用特定亲元素)描述;该元素的上下文特性必须匹配所选择的插入点,基于XML的规则可通过要求特定结构来限制现行版本内的元素的汇编。

b)在本地环境中评估的业务对象规则和特性。特定调配业务数据可规定,特定内容在现行版本范围内或其部分范围内可以是合格的或不合格的。

c)评估元素的属性值、或者元素及其亲元素二者的属性值的规则。环境特性的局部切换可确定内容的合格性和不合格性。一个好的例子是在现行版本的一部分中设置具体语言。

d)成分必须符合某些资格属性以便适合于将其包括在现行版本中的规则。

e)用内容组中的一个成分动态地替代另一个成分,该替代在某些环境变量上发生切换。例如,通过该机制完成在同一段落的英语版本和法语版本之间的切换。

当用户开始创建新出版物的第一版本(图13)时,该系统可以遵照上述方法,以确定元素和成分的候选者。根据该情况,如果没有为一个位置找到匹配元素,则该系统将为该版本中需要的元素插入占位符,遵照该出版物类型的形式结构规则。至少,该版本将由结构占位符构成。最多,该版本将由全部资料库中存在的上下文中的合格成分、以及该资料库中不存在的所需内容的占位符构成。

在该整个系统之下存在有通过文档分析、和/或对组织的风格和业务规则的形式化描述开发的公司文档的结构图。这些结构图遵照一般性描述文档的标准化语法,并且使用XML文档类型定义(DTD)或XML方案。

结构栏编辑界面

本发明针对这样的需要,即,对于结构化文档,尤其是编辑XML文档时对用户友好的编辑器。在编辑结构化文档的已有技术的方法中,众多用户的障碍在于以下两点之一,(a)容易地使用该系统需要知道太多标记语言原理知识,(b)因为仅显示了结构的极少部分,所以出错频繁出现,并且仅当标记有效时错误才被发现。

本发明采用的解决方案是,(1)将文档略图表现为文档中的纯XML方案抽象和实际内容之间的混合,从而用户能感到主题略图;和(2)把包含在文档标记中的结构信息和文档的文本分开,结构信息表现为近似于排版页面的格式并且可以该格式而被编辑(以下表达为“WYSIWYG”)。

本系统的文档编辑系统包括图20中所示的用户界面1,其可由三个主要成分构成:混合树10,其为显示文档结构的可折叠的树,并且可被放置在,但并非限制在显示器的左侧;编者窗格30,显示有可编辑的WYSIWYG文档;和结构栏20,用于以图形形式显示关于编者窗格中的内容的结构信息。该用户界面还可包括具有各种控制按钮和图标的工具栏40。

混合树可被用作分层导航工具,该分层导航工具表示了文档结构,加上由文档规范限定的“需要和遗漏(required-and-missing)”结构。如图21所示的混合树可由容器节点11、成分节点21、虚像节点31、多节点41、和错误指示符51构成。容器节点11可表示文档的结构部分。每一容器节点11可包含若干成分节点21,成分节点21表示文档部分中单独的内容。混合树可被用于通过点击容器节点11或成分节点21的任何一个来选择文档的一部分以进行编辑,在该点,编者窗格被以渲染文档的所选择的部分的WYSIWYG填充。所选择的节点将会保持表示当前所选择的文档部分的突出显示。

虚像节点31可表示文档中不存在、但是文档规范中定义了的部分。与虚像节点31相关联的多节点41可表示该规范在该位置允许成分的重复例子。错误指示符51可被结合虚像节点31来显示,以表示授权在该位置存在成分或容器。用户可通过点击虚像节点31来快速访问该错误,虚像节点31允许添加适当的成分。

该系统还可利用如图23中所示的结构栏那样已知的工具。结构栏20描述了现行版本30的概念上的组织结构,不会影响现行版本30的WYSIWYG显示。该结构栏20通过记录、移动、移除、和插入成分和部分来促进对现行版本结构的操作。该结构栏20还可促进访问/更新成分的元数据,并且警告用户由XML方案描述的现行版本30中任务严重不足。

尽管大多数字处理器便于在WYSIWYG环境中进行编辑,但是,他们不传送关于文档概念结构及其规则的信息。另外,尽管它们是促进结构化文档编辑的XML编辑器,但是它们缺乏WYSIWYG编辑的优点。结构栏20允许对这些“框入的组”作为整体进行操纵,这与利用括号显示的代码编辑器不同。

结构栏20将结构和内容进行清楚的和完整的集成。这帮助了内容编者在熟悉的点和点击编辑环境中进行工作,从而避开了结构内容的复杂性。通过使用拖曳插入、记录和删除成分使得结构改变变得简单。

在垂直方向上显示结构栏20,在左边相邻处,检查现行版本30的显示。显示在右侧的每一成分在左侧具有对应的控制柄。控制柄12是成分82的图标化表示,其可允许直接操纵其相关的成分。控制包12用其对应的成分在垂直方向进行登记。为了移除一成分,控制柄12被拖到垃圾箱图标72。为了移动一个成分,其控制柄12被拖到现行版本30中的新目的地。

另外,容器22在结构栏中具有重复的控制柄。容器22表示现行版本的一部分。它们被图形化地表示为包含成分82的控制柄的框,成分82属于该部分。可以以与表示标准成分的方式相同的方式操纵容器的控制柄。移动/移除该控制柄的效果反映在全部包含的成分中。

为了从现行版本中移除成分82或容器22,其控制柄被拖到垃圾箱图标72。为了移动现行版本中的成分82或容器22,其控制柄被拖到编者窗格中所期望的目的地。为了将成分82插入到现行版本中,把插入图标62拖到编者窗格中所期望的目的地。

结构栏和编者窗格在进行插入/移动成分拖动期间提供虚拟反馈。在越过现行版本30拖动成分82或插入图标62的同时,可在现行版本30中绘出一条表示现行选择的插入点的线。可在最靠近鼠标指针的成分之间的空间绘制插入线。当绘出了这些插入线时,可将包含了所考虑的插入点的容器22突出显示。当两个相邻的成分具有不同的容器时,在这些成分之间插入点的必需数量是可用的,并且,针对每一成分,适当的亲容器可被突出显示。

在控制柄上滚动鼠标可把控制柄突出显示,并且使得工具提示出现。该工具提示可包含脚本元数据,诸如,但不限于,成分的XML标记名称和显示名称。双击控制柄可使得完整的成分元数据面板出现。该面板可显示并允许用户改变和成分相关的数据。

如同在混合树中的情况,遗漏成分指示符32可被显示以标记现行版本30的位置,在现行版本30中,规范所需的内容被遗漏。因此,用户知道必须采取动作以符合规范。通过对其点击或滚动,与任何错误指示符的特性相关的另外的信息都是可得到的。

图24是描述在编辑现行版本时用户可执行的可能的动作的流程图。当用户可选择多个动作之一时,处理在S100开始。例如,在S110,用户可选择在屏幕上编辑文本。其后,在S111,文本的WYSIWYG示图变得可编辑。在编辑了文本之后,用户可在S112按下回车,从而在S113,弹出窗口打开,其中用户可对所编辑的文本进行注释。用户在S114提交注释,并且在S115并且把编辑文本和注释存储在服务器上作为新的修订,并且在S170结束处理。

在S120,用户可抓住控制柄并且将相关的成分拖到不同的位置。其后在S121,该系统确定新位置是否是适当的目的地。如果该目的地是适当的,则在S123,把成分移动到新位置,并且现行版本和结构栏二者把成分显示在新位置。如果该目的地不适当,则在S122,不移动成分。

在S130,用户可抓住控制柄,并且将其拖到垃圾箱图标。在S131,从现行版本移除相关的成分,并且S132确定在现行版本中是否需要成分。如果不需要,则在S170,处理结束。如果需要该成分,则在S133,成分节点被显示为虚像节点。

在S140,通过抓住添加成分图标并且将该图标拖到现行版本中所期望的目的地,用户还可希望把成分添加到现行版本。在S141,弹出窗口出现,并且针对所期望的位置显示全部适当的成分,以便用户在S142进行选择。在进行选择之后,在S143,成分被显示在现行版本、混合树、和结构栏中。

如果用户需要编辑与成分相关联的元数据,则在S150,用户可双击控制柄。在S151,弹出对话框将会出现,用户可编辑与成分相关联的元数据。

用户可能还想要触发结构栏开/关。如果这样的话,在S160,用户可点击结构栏触发按钮。其后,在S161,确定结构栏是否可见。如果结构栏可见,则在S162,使结构栏消失。如果结构栏不可见,则在S163,结构栏出现。

图25描述了现行版本调整次序。在该次序中,在S210,用户使用编者用户界面调整现行版本。在S220,该系统通知服务器以上改变。在S230,服务器执行调整,并且在S240发送调整过的现行版本的快照。在S250,编者显示调整过的现行版本。

图22显示在混合树中用户可能执行的可能的动作。在S305,用户选择要执行的动作。如果在S310用户点击一个节点,则在S311,编者窗格把该节点显示为最高级,并且显示现行版本中的该节点和其对应的子节点的全部内容。如果在S320用户点击可展开的节点的展开标签,则在S321,确定节点是否展开。如果节点未被展开,则在S322,节点改变为展开示图。如果节点被展开,则在S323,节点改变为未被展开的示图。如果在S330用户点击示出显示名称,则在S331,该系统确定显示名称是否被示出。如果显示名称未被示出,则在S332它们出现。如果显示名称未被示出,则在S333,它们消失。如果在S340用户点击示出标签名称,则在S341,该系统确定标签名称是否被示出。如果标签名称未被示出,则在S342它们出现。如果标签名称被示出,则在S343它们不出现。

校样状态、审阅周期、和问题跟踪系统

在用户进行了一系列修订之后,他们可能希望修订如同其要被发布时的格式的版本。为了这个目的,他们可产生一个校样。在本发明中,校样是在一个时间点上现行版本的静态显示,诸如如同PDF、HTML文件等之类的便携格式中的排版页面。具有校对权的用户可在版本活跃的任何时刻产生校样;它们在短时间内是有效的,以便于观看或由客户使用,即,在支持Web或文件传输协议(FTP)的网站或支持其它网络协议的网站上。可以以PDF或其它格式制备校样并在这种网络上进行循环。可以与每一校样一起自动产生若干格式。可对任一过去的校样在任何时刻请求加黑线的校样,作为产生校样的一部分。所产生的校样、成分和出版的校样被存档以便于进一步访问。

本发明的系统引入了审阅周期的概念,在此期间审阅者可观看校样。公司内部的和公司外部的审阅者都可以以电子形式提供注释,它们的注释可被附到校样中的任一点,并且被作为问题跟踪。公司用户可使用电子邮件或相同的内置注释工具来响应。在审阅期间,在审阅者观看冻结的校样同时,用户可对现行版本进行工作。这种注释可以是主动的和非主动的工作,而非等待响应于审阅者的注释进行的改变。

全部注释被收入到问题跟踪系统。问题跟踪注释和疑问,与内容、成分现行状态和适用性、版本、政策等相关。为了出版一个版本可能需要解决问题,以便启动翻译或成分的局部化,或者可制定可影响多份出版物的较广的政策。用户可把优先级分配给一个问题,根据调配配置,每一级均确定系统的表现。可把问题分配给特定团队成员,并且可跟踪它们的状态。可能的问题状态是:打开、修改、解决、和推迟。在限定的情况下,诸如当成分已经过了到期日而没有新的成分可用时,可由用户公布该问题,或由系统自动调用。可由部分用户或另一系统设备采取适当的动作,来由该系统解决诸如成分的遗漏翻译之类的问题。

翻译管理

该系统可管理以多种语言或以多语言版本出版的文档。由于在国家、州、和省级实体之间市场需求和规章要求不同,所以,在设计该系统时也认识到,根据地理环境文档,可能需要进一步的个性化。

因为在超过一个的主权实体中通常说多种语言,所以翻译和地方化是单独的特性。例如,具有其自己的一组国家规定要求的瑞士的文档中通常出现有德语、法语、意大利语、和英语;为了符合瑞士法律而非法国法律,瑞士的法语文本可能需要与法国不同的措辞,这样才能针对每一对语言和地方化特点。该系统可通过其功能来管理该情况,以便在内容组中存储版本,其中,成分可被提供给其它构件,并且成分可对其它构件具有强和弱的依赖性。

在更普遍的情况下,一份出版物最初被以单一的语言创建。由于这很可能是作者(们)的语言情况,所以,原始版本通常变成权威的或“主要的”版本,并且对其成分的修订导致要以其它语言修订版本。这种情况要求翻译版本对主要版本具有很强的依赖性;其它版本可“订阅”原始版本。

在网络扩展时,尤其是当在语言特性和地方化特性或其它特性方面出现分歧时,依赖性变弱。在网络远端的一份出版物可能不会依赖于第一版本,但是与得自于权威的一份出版物的第二出版物相关;这种对原始版本的弱依赖性并不直接导致对网络一端的修订。该出版物可能希望接收对原始权威版本的修订,但是并非被强迫按其修订来进行修订。

该系统可被配置以监视在比主要的版本的语言次要的语言中的成分版本存在与否。假设存在有或创建了一种次要语言的出版物,该系统可自动汇编不具有该语言的版本的成分,以分配给译者或翻译服务提供商。尽管能够以调配来配置用于交换的精确机制,但是其还包括:

1.将结构化文件传输给译者,或从译者接收结构化文件

2.用于实时翻译的专用浏览器界面

3.用于成批或实时翻译的直接数据资料库链接

每一缺乏所需翻译的成分均具有对其提出的问题。当翻译被返回和上载时,该系统把该问题的状态改变为已解决。可在客户的工作过程的调配下配置该问题显示屏幕,显示每一个这种翻译问题并且通过问题类型来构造子集。

除了语言翻译和地方化之外,制作版本也启动进行文档出版策略。其支持在同一国家进行文件编排,以控制具有针对地方政府的变化的文档。例如,在美国,保险计划具有专门用于州的一致性内容。产品手册可包含针对消费者的扩展的销售信息和针对服务组织的所有权信息。目录可针对专门的市场。

许可

该系统允许管理员把访问/编辑许可和工作组成员资格提供给用户。其还允许在公司内或公司外对系统设备进行有差别的访问。当接收到来自用户的请求时,校样添加客户机界面(命令层)实施许可。通过控制用户的屏幕显示和当用户登录时显示的其它系统动作的portlet,该许可系统控制该系统单独的示图。例如,分派的任务是管理文档的用户将会综合显示全部系统对象:出版物档案库、现行版本、问题跟踪、团队、和现行版本的审阅状态的完全连接示图。作为供稿人的编者将会看到更有限的示图,仅允许对那些现行版本或相关的系统设备进行访问,现行版本是他/她做出了贡献的现行版本。

该系统可包括请求处理器,请求处理器管理若干离散的用户许可,诸如,但不限于:

●创建文档

●作者成分

●编辑成分特性

●编辑元素使用规则

●审阅校样

●对校样进行注释

●更新(编辑)文档

●产生校样

●批准和移除文档

●出版文档

●更新业务对象表

●访问、创建、和编辑表(内容)

●从资料库中删除成分

●访问、创建、和编辑脚注

●接收已被出版的文档的自动通知

●接收已被创建的新文档的自动通知

●每当表被更新到文档时就接收自动通知

●在客户机侧进行系统管理

●在服务器侧进行系统管理

●印刷产品规范

●通信备忘录

在本发明的实施例中,用户界面在互联网上工作以使用户连接到系统服务器。命令层检查用户许可,并且监视用户的选择并返回适当的响应,这都对用户开放并且隐藏(诸如归档)。例如,在该系统中使用的资料库、档案库、和程序被存储在网络服务器上。在该系统的实施例中,用户通过使用他们的浏览器作为访问入口登录网站来和系统交互。审阅者可通过互联网而被引入协同工作处理。因为界面和检索工具都基于互联网,所以,该系统总是可用的,并且可跨越时区从能够访问互联网的任何装置进行工作。

印刷准备

在进行印刷出版的系统的实施例中,该系统自动进行很多步骤使得被批准的校样变为准备印刷的文件。被批准的校样的颜色模型被变为CMYK,公司标志和其它印刷标志被插入,并且渲染文件的整版结构适合于颜色分离和制版完成。另外,该系统可以以网络准备的红绿蓝(RGB)颜色来生产安全的和压缩的PDF,将通知发送到用户和管理员,并且就业务和印刷通知进行通信。其后,该文档被移动到出版的档案库。其它输出目的地可被加到该处理以支持最终校样的不同示图。

尽管它们由自动的、可重复使用的成分构成,但是,全部出版物必须被管理为好像它们是传统文档。一旦一个版本已被出版,则其被存储在文档档案库中作为一系列结构文件,并且作为虚拟文档,即其元素的图。其它目的格式的最新例子,诸如HTML或EDGAR II,也被存储在档案库中。当一个版本是活跃的时,该档案库维持该文档的全部校样以进行加黑线操作,并作为恢复模型。该档案库不是成分资料库的一部分,而是该系统的单独的部分。

用户对操作中的系统的概念示图

从一些用户的观点看到的出版处理的描述在图27、28、和29中示出,并且可被总结如下:

首先,作为一个版本的管理员的用户创建的一份出版物的一个版本。一个版本是一份出版物的周期性的迭代,不管迭代是由预定进度表发起或者由市场/规章要求发起。版本可结合新的内容和/或以前版本的修订。当新版本被制备好时,其被称为现行版本。该现行版本被编辑,当被保证或被期望时,其包括对新成分的追加。该用户现在可编辑汇编过的现行版本,通过混合树显示来进行导航,并且如上所述在编辑面板中进行改变。

管理该版本的用户可在任何时刻请求现行版本的校样。该用户可请求原始版本以外的被加了黑线的校样。加黑线操作可以是动态的,即,新校样可被与任一其它校样进行比较,或者根据用户请求与文档的打开状态进行比较。每当用户产生一个校样时,他们能够选择接收加黑线的校样,并且选择该校样来进行比较。因此,可证明累积改变的变化等级。

随后,管理该版本的用户发布校样以进行审阅和注释。管理员可从多个发布列表中选择添加单独的接收者。审阅者、编者、和管理员可通过互联网或其它网络连接来访问校样。把对文档成分的改变和注释从校样到校样来做标志。当审阅一份校样时,用户可能对需要被检查的校样有问题,通过进行电子注释,用户把注释输入到问题跟踪系统。

用户还可考虑进行审计追踪,以跟踪成分内容的全部变化,如,谁、何时、在什么环境中、和为什么进行修订。对每一修订,这些改变被显示为具有完全的统计信息的加黑线的显示。审计追踪对于金融机构也可能是有用的,由于规章要求已经由美国政府建立,诸如2002年的Sarbanes Oxley法案,所述金融机构必须保持详细的记录。

具有适当的许可的用户可根据需要编辑、校对、和审阅校样。特许用户可批准一份校样作为该版本的最终版本,其后,“出版”批准的校样。如图19所示,当出版了批准的校样时,该校样以在调配时建立的特定格式被批准发布给其所期望的一组接收者。出版的文档表示被归档的现行版本的最终状态。尽管特定调配可创建所用的印刷母版,可将特定的电子格式传送到某些接收方,并且可将出版物贴到Web上或其它网站上,但是,这些动作都在该系统的出版动作之后,并且不会影响被出版的文档的基础存储结构。

在校样被批准出版之后,审阅者或编辑可确定一个成分或多个成分可能需要被编辑。在此例中,对出版的批准可被取消。当取消时,供稿人和版本管理员可选择照常进行汇编和编辑,或者可请求被称作受限编辑的操作模式。在受限编辑过程中,用户看到现行版本的共享成分的列表,由于现行版本已被批准出版,所以该现行版本已被修订。该用户可选择把这些修订应用于受限模式下的现行版本或不应用。发起被批准的取消操作的任一编辑操作可被仅应用于现行文档(而且在该版本期满),可被立即应用于全部合格的文档,或者可被应用于全部未来合格的现行版本。

尽管本发明的优选实施例及其改变已在此被详细描述,但是,应该理解,本发明不限于这些精确的实施例和改变,而且,在不脱离由所附权利要求限定的本发明的精神和范围的情况下,可由本领域技术员做出其它的改变和变形。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号