首页> 中国专利> 一种基于嵌入元语言指令的文本处理方法及装置

一种基于嵌入元语言指令的文本处理方法及装置

摘要

本发明公开了一种基于嵌入元语言指令的文本处理方法及装置,其包括:用户对原始文本文件键入元语言指令,生成嵌入了元语言指令的文本文件;过滤引擎对嵌入了元语言指令的文本文件进行处理,识别嵌入的元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出;生成目标文件。本发明能够节省文件存储空间,降低人力维护成本,同时保护文件内容的安全。

著录项

  • 公开/公告号CN102831215A

    专利类型发明专利

  • 公开/公告日2012-12-19

    原文格式PDF

  • 申请/专利号CN201210293466.6

  • 发明设计人 张扬;

    申请日2012-08-17

  • 分类号G06F17/30(20060101);G06F17/21(20060101);

  • 代理机构

  • 代理人

  • 地址 100193 北京市海淀区中关村软件园信息中心大厦A106

  • 入库时间 2023-12-18 07:46:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-02

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/30 变更前: 变更后: 变更前: 变更后: 申请日:20120817

    专利权人的姓名或者名称、地址的变更

  • 2019-05-07

    专利权质押合同登记的注销 IPC(主分类):G06F17/30 授权公告日:20160608 登记号:2017990000508 出质人:芯原微电子(北京)有限公司|芯原微电子(上海)有限公司|芯原微电子(成都)有限公司 质权人:国家集成电路产业投资基金股份有限公司 解除日:20190415 申请日:20120817

    专利权质押合同登记的生效、变更及注销

  • 2017-07-18

    专利权质押合同登记的生效 IPC(主分类):G06F17/30 登记号:2017990000508 登记生效日:20170621 出质人:芯原微电子(北京)有限公司|芯原微电子(上海)有限公司|芯原微电子(成都)有限公司 质权人:国家集成电路产业投资基金股份有限公司 发明名称:一种基于嵌入元语言指令的文本处理方法及装置 授权公告日:20160608 申请日:20120817

    专利权质押合同登记的生效、变更及注销

  • 2016-06-08

    授权

    授权

  • 2013-08-07

    专利申请权的转移 IPC(主分类):G06F17/30 变更前: 变更后: 登记生效日:20130717 申请日:20120817

    专利申请权、专利权的转移

  • 2013-06-12

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20120817

    实质审查的生效

  • 2012-12-19

    公开

    公开

查看全部

说明书

技术领域

本发明涉及电子数字数据处理技术领域,特别是涉及一种基于嵌入元语言指 令的文本处理方法及装置。

背景技术

电子数字文本文件用于记录、传递和表达文字内容,已经广泛应用于计算机 应用各个领域。在实际应用过程中,人们经常需要针对不同对象基于相同原始文 本文件发布内容不同甚至是部分加密的最终发布文本。然而对于这种需求,鲜有 有效的方法可以使用。通常只能通过手工编辑的方式来完成。

上述手工编辑的方法易于出错,需要保存大量基于相同原始文本而又内容不 同的发布文本文件浪费存储空间,日后还要针对每个不同的发布文本文件进行维 护浪费人力。

发明内容

本发明的一个目标是提供一种方法及装置,用于在计算机可读文本文件中嵌 入元语言指令并且可以方便的对特定内容进行过滤和加解密生成所需的文本内 容,用以保护文本内容,减少维护成本和节省存储空间。

本发明提供了一种基于嵌入元语言指令的文本处理方法,其包括以下步骤:

步骤(a)用户对原始文本文件键入元语言指令,生成嵌入了元语言指令的 文本文件;

步骤(b)过滤引擎对嵌入了元语言指令的文本文件进行处理,识别嵌入的 元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出;

步骤(c)生成目标文件。

进一步,该元语言指令包括用于定义预设的条件的条件定义指令、用于清除 预设的条件的条件清除指令、用于过滤选取文本的条件判断指令及结束指令、用 于选择性加密选定文本内容的加密指令、加密结束指令、用于选择性解密选定文 本内容的解密指令以及解密结束指令。

其中,步骤(b)进一步包括:

步骤(1)过滤引擎使用传入条件初始化自身及过滤条件库;

步骤(2)过滤引擎判断输入文件是否结束,如果结束进入步骤(29)过滤引 擎进行退出处理释放资源;如果尚未结束,进入步骤(3);

步骤(3)从输入文件读取一个单字;

步骤(4)判断当前读入单字是否为元语言指令字前缀,如果是元语言指令字 前缀则转入步骤5,否则转入步骤(22);

步骤(5)判断当前指令是否为元语言条件定义指令,如果是元语言条件定义 指令则进入步骤(6);

步骤(6)读取待定义的条件和可选的值,过滤引擎定义该条件并存入条件库 中;下一步转步骤(2);如果步骤(5)判断不是元语言条件定义指令则转入步 骤(7);

步骤(7)判断当前指令是否为元语言条件清除指令,如果是元语言条件清除 指令则进入步骤(8);如果判断不是元语言条件清除指令则转入步骤(9);

步骤(8)读取待清除的条件,如果在条件库中找到该条件,过滤引擎从条件 库中删除该条件,下一步转步骤(2);

步骤(9)判断当前指令是否为元语言条件判断指令,如果是元语言条件判断 指令则进入步骤(10);如果判断不是元语言条件判断指令则转入步骤(12);

步骤(10)读取待判断的条件,并在条件库中搜索该条件和对应的值,进入 步骤(11);

步骤(11)如果在条件库中找到该条件且条件值匹配,过滤引擎根据当前环 境生成新的条件环境并压入环境栈,否则直接生成滤出条件环境并压入环境栈, 下一步转步骤(2);

步骤(12)判断当前指令是否为元语言条件判断结束指令,如果是元语言条 件判断结束指令则进入步骤(13),如果判断不是元语言条件判断结束指令则转 入步骤(14);

步骤(13)过滤引擎将当前条件环境栈出栈,下一步转步骤(2);

步骤(14)判断当前指令是否为元语言加密指令,如果是元语言加密指令则 步骤(15),如果判断不是元语言加密指令则转入步骤(16);

步骤(15)过滤引擎进入加密状态,下一步转步骤(2);

步骤(16)判断当前指令是否为元语言加密结束指令,如果是元语言加密结 束指令则进入步骤(17);如果判断不是元语言加密结束指令则转入步骤(18);

步骤(17)过滤引擎退出加密状态,下一步转步骤(2);

步骤(18)判断当前指令是否为元语言解密指令,如果是元语言解密指令则 进入步骤(19);如果判断不是元语言解密指令则转入步骤(20);

步骤(19)过滤引擎进入解密状态,下一步转步骤(2);

步骤(20)判断当前指令是否为元语言解密结束指令,如果是元语言解密结 束指令则进入步骤(21),如果判断不是元语言解密结束指令则转入步骤(22);

步骤(21)过滤引擎退出解密状态,下一步转步骤(2)。

其中,步骤(b)进一步包括:

步骤(22)从输入文件当前位置读取一个字符串;

步骤(23)判断当前的环境是否允许输出,如果允许输出,则进入步骤(24);

步骤(24)判断是否进入加密状态,如果进入加密状态,进入步骤(25);如 果未进入加密状态则进入步骤(26);

步骤(25)加密该字符串并写入输出文件;

步骤(26)判断是否进入解密状态,如果进入解密状态,进入步骤(27);否 则进入步骤(28);

步骤(27)解密该字符串并写入输出文件;

步骤(28)直接将该字符串写入输出文件,下一步转步骤(2)。

进一步,步骤(5)包括:

如果条件库中如有同名条件,则用新条件值覆盖旧条件值。

进一步,步骤(a)所述嵌入是用户以字符串的形式嵌入元语言指令,过滤引 擎识别该字符串。

本发明还提供了一种基于嵌入元语言指令的文本处理装置,其包括以下单元: 键入单元,用户对原始文本文件键入元语言指令,生成嵌入了元语言指令的文本 文件;处理单元,过滤引擎对嵌入了元语言指令的文本文件进行处理,识别嵌入 的元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出;生成单元, 生成目标文件。

进一步,该元语言指令包括用于定义预设的条件的条件定义指令、用于清除 预设的条件的条件清除指令、用于过滤选取文本的条件判断指令及结束指令、用 于选择性加密选定文本内容的加密指令、加密结束指令、用于选择性解密选定文 本内容的解密指令以及解密结束指令。

进一步,所述键入单元是用户以字符串的形式嵌入元语言指令,过滤引擎识 别该字符串。

本发明提供的在文本中嵌入元语言指令的方法,对于存储、维护内容相关度 较高的文本的需求,提供了一种优化方案。本发明提供的过滤方法可以针对不同 预设条件及其组合有效过滤嵌入本发明提供的元语言指令的文本。整个方案能够 节省文件存储空间,降低人力维护成本,同时保护文件内容的安全。

附图说明

图1是示出根据本发明的用户键入元语言指令的流程图;

图2是根据本发明的方法的整体流程图;

图3-1至图3-10是根据本发明的过滤引擎具体进行过滤的流程图。

具体实施方式

为使本发明的上述目的、特征和优点更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明:

在本发明的方法中,首先需要将元语言指令嵌入原始文本文件,如图1所示, 具体包括步骤(1):提取原始文本文件I2;步骤(2)用户进行编辑,键入元语 言指令I1,该指令包括用于定义预设的条件的条件定义指令、用于清除预设的条 件的条件清除指令、用于过滤选取文本的条件判断指令及结束指令、用于选择性 加密选定文本内容的加密指令、加密结束指令、用于选择性解密选定文本内容的 解密指令以及解密结束指令;步骤(3)用于将用户键入的元语言指令嵌入到原 始文本文件中生成嵌入了元语言指令的文本文件I3。

图2表示根据本发明的方法的整体流程图,即过滤引擎处理嵌入元语言指令 的文本文件并生成目标文件的过程。如II1所示用户启动过滤引擎并传入必要参 数,如待过滤文本文件路径和目标文件路径,过滤条件,密钥等信息。如II2所 示过滤引擎读入嵌入了元语言指令的文本文件II3,对该文件进行分析,识别嵌 入的元语言指令,根据元语言指令选择性过滤和加解密文本内容并输出,最后生 成过滤后的文本文件II4(即目标文件)。

所述过滤引擎,用于对嵌入了上述元语言指令的文本文件进行处理,生成按 需过滤或加密、解密的目标文件。

本发明的一个关键内容是利用嵌入的元语言指令指导过滤引擎过滤文本。该 元语言指令是一组命令用以指导过滤引擎对所嵌入的文本文件完成相应的处理 过程。基本原则是过滤引擎读入文本内容,识别嵌入的元语言指令,逐一对每一 条元语言指令解释并对其涵盖的文本内容执行特定处理。

本发明提供如下元语言指令,

条件定义指令,包括参数1:待定义的条件标示符;参数2(可选):待定义 的条件值。条件定义指令和条件标示符及可选的条件值作为字符串传给过滤引擎。 过滤引擎定义该条件并存入条件库中。条件库中如有同名条件,则用新的条件值 覆盖旧的条件值。定义的条件标示符和条件值供条件判断指令使用。

条件清除指令,包括参数:待清除的条件标示符。条件清除指令和条件标示 符作为字符串传给过滤引擎。如果在条件库中找到该条件,过滤引擎从条件库中 删除该条件。

条件判断指令,包括参数1:待判断的条件标示符;参数2(可选):用于匹 配的条件值。条件判断指令和条件标示符及可选的条件值作为字符串传给过滤引 擎。过滤引擎在条件库中搜索该条件,并根据搜索结果及当前环境生成新的当前 条件环境并压入环境栈。生成条件环境的具体过程如下:如果找到该条件且条件 值匹配,并且当前条件环境处于输出状态,那么新生成的条件环境仍然处于输出 状态,否则新生成的条件环境处于过滤状态,生成滤出条件环境并压入环境栈。 当前条件环境处于输出状态时,非元语言指令文本将会直接或被进一步处理后输 出;当前条件环境处于过滤状态,非元语言指令文本将会被过滤掉。

条件判断结束指令,条件判断结束指令作为字符串传给过滤引擎。过滤引擎 将当前条件环境压出栈,过滤动作结束。

加密指令:密钥。加密指令作为字符串传给过滤引擎。如果当前密钥不存在, 过滤引擎将生成一个密钥。如果当前条件环境为输出状态,则进入输出加密状态。 处于输出加密状态下的非元语言指令文本将被加密后输出。

加密结束指令,加密结束指令作为字符串传给过滤引擎。过滤引擎退出加密 状态。

解密指令,包括参数(可选):密钥。解密指令和密钥作为字符串传给过滤引 擎。过滤引擎保存密钥。如果当前条件环境为输出状态,则进入输出解密状态。 处于输出解密状态下的非元语言指令文本将被解密后输出。

解密结束指令,解密结束指令作为字符串传给过滤引擎。过滤引擎退出解密 状态。

整个过滤引擎的过滤过程II2的流程图进一步由图3-1至图3-10描述。

如图3-1:步骤1过滤引擎使用传入条件(该传入条件包括输入输出文件路径, 用于过滤的条件定义及密钥)初始化自身及过滤条件库。步骤2过滤引擎判断输 入文件是否结束。如果结束进入步骤29过滤引擎进行退出处理释放资源。如果尚 未结束,进入步骤3从输入文件读取一个单字。下一步骤4判断当前读入字符是否 为元语言关键字前缀。如果是元语言指令字前缀则转入图3-2步骤5,否则转入图 3-10步骤22。

如图3-2:步骤5判断当前指令是否为元语言条件定义指令。如果是元语言条 件定义指令则步骤6从输入文件读取待定义的条件和可选的值,过滤引擎定义该 条件并存入条件库中。条件库中如有同名条件,则用新值覆盖旧值。下一步转图 3-1步骤2。如果步骤5判断不是元语言条件定义指令则转入图3-3步骤7。

如图3-3:步骤7判断当前指令是否为元语言条件清除指令。如果是元语言条 件清除指令则步骤8从输入文件读取待清除的条件,如果在条件库中找到该条件, 过滤引擎从条件库中删除该条件。下一步转图3-1步骤2。如果步骤7判断不是元 语言条件清除指令则转入图3-4步骤9。

如图3-4:步骤9判断当前指令是否为元语言条件判断指令。如果是元语言条 件判断指令则步骤10从输入文件读取待判断的条件,并在条件库中搜索该条件和 对应的值。接着步骤11如果在条件库中找到该条件且条件值匹配,过滤引擎根据 当前环境生成新的条件环境并压入环境栈。生成条件环境的具体过程如下:如果 找到该条件且条件值匹配,并且当前条件环境处于输出状态,那么新生成的条件 环境仍然处于输出状态,否则新生成的条件环境处于过滤状态。当前条件环境处 于输出状态时,非元语言指令文本将会直接或被进一步处理后输出;当前条件环 境处于过滤状态,非元语言指令文本将会被过滤掉。下一步转图3-1步骤2。如果 步骤9判断不是元语言条件判断指令则转入图3-5步骤12。

如图3-5:步骤12判断当前指令是否为元语言条件判断结束指令。如果是元语 言条件判断结束指令则步骤13过滤引擎将当前条件环境栈出栈。下一步转图3-1 步骤2。如果步骤12判断不是元语言条件判断结束指令则转入图3-6步骤14。

如图3-6:步骤14判断当前指令是否为元语言加密指令。如果是元语言加密指 令则步骤15过滤引擎进入加密状态。下一步转图3-1步骤2。如果步骤14判断不是 元语言加密指令则转入图3-7步骤16。

如图3-7:步骤16判断当前指令是否为元语言加密结束指令。如果是元语言加 密结束指令则步骤17过滤引擎退出加密状态。下一步转图3-1步骤2。如果步骤16 判断不是元语言加密结束指令则转入图3-8步骤18。

如图3-8:步骤18判断当前指令是否为元语言解密指令。如果是元语言解密指 令则步骤19过滤引擎进入解密状态。下一步转图3-1步骤2。如果步骤18判断不是 元语言解密指令则转入图3-9步骤20。

如图3-9:步骤20判断当前指令是否为元语言解密结束指令。如果是元语言解 密结束指令则步骤21过滤引擎退出解密状态。下一步转图3-1步骤2。如果步骤20 判断不是元语言解密结束指令则转入图3-10步骤22。

如图3-10:步骤22从输入文件当前位置读取一个字符串。步骤23判断当前的 环境是否允许输出。如果允许输出,则步骤24判断是否进入加密状态。如果进入 加密状态,步骤25加密该字符串并写入输出文件。如果未进入加密状态则步骤26 判断是否进入解密状态。如果进入解密状态,步骤27解密该字符串并写入输出文 件。否则步骤28直接将该字符串写入输出文件。下一步转图3-1步骤2。

综上所述,本发明提供的在计算机可读文本文件中嵌入元语言指令并通过过 滤引擎处理嵌入元语言指令文本文件的方法可以有效地按需过滤和加密文本内 容并能解密嵌入的已加密的内容,从而节省文件存储空间,降低人力维护成本, 同时保护文件内容的安全。

以上是对本发明的优选实施例进行的详细描述,但本领域的普通技术人员应 该意识到,在本发明的范围内和精神指导下,各种改进、添加和替换都是可能的。 这些都在本发明的权利要求所限定的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号