首页> 中国专利> 同时满足格式和内容分离与混排需求的文档记录方法

同时满足格式和内容分离与混排需求的文档记录方法

摘要

本发明涉及同时满足格式和内容分离与混排需求的文档记录方法,包括在外存生成文档的格式描述和内容描述,并建立格式描述和内容描述的映射关系,将格式描述和内容描述以及两者之间的映射关系存入外存的文件系统中;判断是否需要进行混排编辑,如果需要则根据映射关系加载相应的内容描述和格式描述,在内存中建立格式描述和内容描述的映象及其关联,对文档进行混排,并对混排的文档进行编辑;如果不需要混排编辑,则根据需要单独提取内容描述或格式描述,并对格式描述或内容描述分别进行处理。本发明既满足了所见即所得风格的编辑器内容与格式混排的要求,又满足了格式与内容分离应用的需要。

著录项

  • 公开/公告号CN1680933A

    专利类型发明专利

  • 公开/公告日2005-10-12

    原文格式PDF

  • 申请/专利权人 中国电子技术标准化研究所;

    申请/专利号CN200410030997.1

  • 发明设计人 李宁;吴志刚;赵菁华;高林;

    申请日2004-04-05

  • 分类号G06F17/21;

  • 代理机构11205 北京同立钧成知识产权代理有限公司;

  • 代理人刘芳

  • 地址 100007 北京市东城区安定门东大街1号

  • 入库时间 2023-12-17 16:33:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2009-11-11

    授权

    授权

  • 2005-12-07

    实质审查的生效

    实质审查的生效

  • 2005-10-12

    公开

    公开

说明书

技术领域

本发明涉及一种文档记录格式的描述方法,尤其是一种同时满足格式和内容分离与混排需求的文档记录方法,适用于支持可扩展置标语言(XML)的文档编辑及处理工具在文件中记录或从文件读入文档的内容和显现形式,属于计算机办公自动化技术领域。

背景技术

长期以来,文档主要采用专用的记录格式来描述,采用专用格式带来必然严重的兼容性问题,例如,WPS文档编辑器难以正确解释Word采用的DOC格式,当前使用的PowerPointer不能正确解释老版本的PPT格式,等等;同时,文档的处理能力也会受文档处理工具提供厂商的制约。近年来,随着可扩展置标语言XML应用的兴起,文档的记录格式越来越多地采用XML来描述。例如,Oasis的办公软件OpenOffice,Microsoft的办公软件Office2003等等。采用XML描述文档,能够通过定义大纲(schema)来规范文档的记录格式,并对其进行验证,并大大增强文档格式的交换能力。XML也促使了文档显现格式与内容的分离,这种分离一方面有助于保持相对稳定的文档逻辑内容信息,使其不受排版风格的影响,各种应用还可定义与各自领域相关的大纲来规范如何描述文档的逻辑内容,并与其他的应用系统集成。另一方面也使得相同类型的文档,只需一次排版得到式样单(stylesheet)便可具有一致的显现格式,不需要对每篇文档进行排版。然而,作为文档编辑工具使用的文档记录格式,一方面,要尽可能支持所见即所得的友好的编辑风格,这要求格式与内容混合编排;另一方面,最好还能支持文档格式与内容的分离,这两者本身是有矛盾的。现有技术中公开的文档记录格式,一般是通过定义与编辑处理相关的大纲,来支持混合的文档显现格式与内容信息,不能很好地同时支持上述两种需求,用途单一,难以与其它应用系统集成。

发明内容

为克服上述不足,本发明的目的是提供一种同时满足格式和内容分离与混排需求的文档记录方法,格式和内容分开描述,共存于一个记录文件中,应用程序根据需要对格式和内容进行单独或混合处理。

为实现上述目的,本发明采取的技术方案是:同时满足格式和内容分离与混排需求的文档记录方法,文档记录格式包括格式描述和内容描述,包括下述步骤:

a.在外存生成文档的格式描述和内容描述,并建立格式描述和内容描述的映射关系,将格式描述和内容描述以及两者之间的映射关系存入外存的文件系统中;

b.判断是否需要进行混排编辑,如果需要则根据映射关系加载相应的格式描述和内容描述,在内存中建立格式描述和内容描述的映象及其关联,对文档进行混排,并对混排的文档进行编辑;

c.如果不需要混排编辑,则根据需要单独提取格式描述或内容描述,并对格式描述或内容描述进行编辑或处理。

所述步骤a中格式描述和内容描述为可扩展置标语言形式的树形数据结构,具有不同的根节点和不同的命名空间。

所述步骤a中的格式描述和内容描述按压缩或非压缩的二进制或纯文本数据存储成文件。

所述步骤a中的格式描述和内容描述任一可以为空或同时为空,格式描述为空表示文档未指定显现格式,内容描述为空表示没有可供显现的内容。

所述步骤a中的映射关系是由标识符表达的,使格式描述和内容描述之间建立起对应关系。

所述步骤b中的编辑处理是指修改格式描述和内容描述或维护其正确的映射关系或分别对格式描述和内容描述进行有效性验证。

所述步骤b中的对混排的文档进行编辑处理时,格式描述和内容描述的对应关系由编辑工具动态产生和维护。

本发明与现有技术相比,具有明显的优点和有益的效果。本发明将文档描述分为格式描述和内容描述两部分,将文档的格式信息和逻辑内容信息分别描述,建立两者的映射关系,并记录在同一文件中。应用程序在需要的时候可以分别提取,并且保持两者的同步一致,满足了所见即所得风格的文档编辑工具所需的格式内容混排的要求,同时又保留了格式与内容分离的优点,克服了现有文档记录格式方案的不足。本发明大大方便了文档的编辑、处理以及与其他应用系统的集成,具有较高的通用性、灵活性和实用性。

附图说明

图1是本发明的主流程图;

图2本发明记录格式的格式描述和内容描述的映射关系示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明。

请参阅图1,本发明的主流程图,首先生成文档的格式描述(FD)和内容描述(CD)。FD与CD均采用XML语法。其中FD与文档显现相关,例如页面版式、字形、字体大小和颜色、行间距等,通常也称为文档格式的XML实例,CD与文档逻辑内容相关,如书籍、论文、信函的不同层次结构等,通常也称为用户定义内容的XML实例。

然后,建立格式描述和内容描述的映射关系,并将格式描述、内容描述及两者之间的映射关系存入同一外存记录文件中。

本发明的格式描述和内容描述映射关系是格式描述和内容描述之间建立的一种对应关系。映射关系由标识符(ID)或其他定位机制如统一资源标识(URI)表达。例如,将内容描述的“标题”部分标识为“1”,将显现格式即表格的第一行第一列标识为对标识符“1”的引用,则建立起的映射关系就是“将标题部分显示在表格的第一行第一列之中”。

格式描述和内容描述均为可扩展置标语言(XML)形式的树形数据结构,具有不同的根节点和不同的命名空间。格式描述和内容描述可以按压缩或非压缩的二进制或纯文本数据存储成文件。

格式描述和内容描述可以其中之一为空或同时为空,格式描述为空表示文档未指定显现格式,内容描述为空表示没有可供显现的内容。

一个文档编辑器在打开文件时,读入格式描述和内容描述及其映射关系,在文档编辑界面中显示格式内容混合的文档,而在内存中独立保持格式和内容的映象数据,并在动态编辑过程中维护两者之间的关联。

一个文档编辑器可以引入用户定义大纲(schema),对内容描述进行有效性验证,引入文档格式大纲对格式描述进行有效性验证。

一个与文档内容相关的处理系统,例如,摘取文档中的部分数据加入到其他应用中去的程序,可以只传送内容描述而不需传送冗长的格式描述从而减少传输成本。

一个按需排版的系统,可能已经具备用于显现文档格式的式样单(stylesheet),可以忽略文档的格式描述,而只读取文档的内容描述,从而排出所需的格式。例如,对于一篇论文,作者可能采用文本编辑器编辑出用于单独出版的格式,但是,如果放在论文集中出版,则需要按论文集统一的风格排版,这时,可以从编辑器生成的文件中提取内容描述的部分,而忽略格式描述的部分,然后结合论文集的式样单,编排出论文集所需的显现形式。由此可见,这种方式可以使一份文档按照需要呈现不同的显现形式。

实施例:请参见图2,本发明记录格式的CD和FD的映射关系示意图,实施例的具体内容请参见图3,本发明一个实施例的格式描述和内容描述。本发明实施例是由两个XML实例CD和FD构成的、符合本发明文档记录格式的文件。1-11行为CD,13-41行为FD。

CD描述了以XML树形结构表示的一本书的逻辑内容。根节点为书(Book)”,其子节点包括“标题(Title)”、“作者(Author)”、“出版年份(Year)”、“书号(ISBN)”、“出版商(Publisher)”。其中各个子节点均有唯一标识符(ID),Title的ID为1,Author的ID为2,Year的ID为3,ISBN的ID为4,Publisher的ID为5。其中所有的元素均属于命名空间cd。

FD描述了其显现格式,即通过表格(Table)的形式,用单行(row)五列(col)的表格显示书的内容。其中,text元素的ID引用属性(idref)指明第一列对应CD中ID为1的节点,即Title,第二列对应CD中ID为2的节点Author,第三列对应CD中ID为3的节点Year,第四列对应CD中ID为4的节点ISBN,第五列对应CD中ID为5的节点Publisher。其中所有的元素均属于命名空间fd。

通过上述记录格式,建立了CD到FD两棵XML树之间的关联。图2左边为CD XML树,右边为FD XML树,CD与FD节点间的虚线箭头表示通过ID及其引用建立的关联关系。

最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,对于不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号