首页> 中国专利> 基于自然语言信息转换和行为模拟的数据交换装置及方法

基于自然语言信息转换和行为模拟的数据交换装置及方法

摘要

本发明公开了一种基于自然语言信息转换和行为模拟的数据交换装置及方法,是在目标系统的数据交换过程中,通过输入基于自然语言的流程和对目标系统的当前工作状态的采集,以及将目标系统的当前工作状态的量化数据转化为标准的自然语言后,利用目标系统的当前工作状态和反映输入基于自然语言的流程的目标行为的差值计算,校正出偏差,使行为模拟装置实现对目标系统的操作,并通过上述操作实现对目标系统数据的读取或写入。本发明是将自然语言信息转换和行为模拟相结合,从而在无须编写接口的情况下,能够方便、快捷地实现系统间的数据交换。

著录项

  • 公开/公告号CN104360995A

    专利类型发明专利

  • 公开/公告日2015-02-18

    原文格式PDF

  • 申请/专利权人 陈飞;唐永新;

    申请/专利号CN201410446722.X

  • 发明设计人 陈飞;唐永新;

    申请日2014-09-03

  • 分类号G06F17/28;G06F9/44;

  • 代理机构厦门市首创君合专利事务所有限公司;

  • 代理人连耀忠

  • 地址 310000 浙江省杭州市滨江区伟业路彩虹豪庭2幢202室

  • 入库时间 2023-12-17 03:49:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-02-27

    授权

    授权

  • 2015-03-25

    实质审查的生效 IPC(主分类):G06F17/28 申请日:20140903

    实质审查的生效

  • 2015-02-18

    公开

    公开

说明书

技术领域

本发明涉及计算机技术领域和自动化控制领域,特别是涉及一种基于自然语言信息转 换和行为模拟的数据交换装置及方法。

背景技术

当前采用的各类系统间数据交换只有手工操作和编写接口两种主要方法。编写接口的 方法需要知道被交换系统的数据格式、或者服务协议,而被交换系统也需要相互开放访问权 限。为此,存在的弊端是:第一,降低了系统的安全性,第二,开发工作量巨大,每个类型 的数据和另一系统进行数据交换都需要编写接口,第三,如果相互交换的系统中的一个进行 了结构化变更,一旦该变更改变了原来的接口通讯相关的内容,则会导致交换失败。而对于 手工操作来说,手工操作的方法则耗时、耗力、容易出错。

发明内容

本发明的目的在于克服现有技术之不足,提供一种基于自然语言信息转换和行为模拟 的数据交换装置及方法,是将自然语言信息转换和行为模拟相结合,从而在无须编写接口的 情况下,能够方便、快捷、安全地实现系统间的数据交换。

本发明解决其技术问题所采用的技术方案是:一种基于自然语言信息转换和行为模拟 的数据交换装置,包括:

自然语言语义行业百科模块,该模块的作用在于将各行业对包括计算机在内的各类设 备的操作行为及规则的描述设置为与对应的自然语言描述相关联;

自然语言语义转换模块,该模块的作用在于利用自然语言语义行业百科模块中定义的 设备操作行为、输出结果处置方法及对应规则描述与自然语言描述的关联关系,将输入的设 备操作行为、输出结果处置方法及对应规则描述、以及各采集设备所采集到的数据,在自然 语言以及各设备原本的表述方式之间转换,以便将各种检测设备的输出参数、各类设备的操 作描述、输入、输出以自然语言为媒介形成关联关系,获得行业级的统一信息交换基础;

信息采集分析模块,该模块的作用在于对拟进行数据交换的目标系统的当前工作状态 进行数据采集并将采集的数据进行量化处理,其采集方式、方法、采集序列均按照行业百科 模块中记载的与自然语言描述相关联的设备操作行为、输出结果处置方法及对应规则进行;

输入模块,该模块用来输入实现系统间数据交换的包括行为、目标、规则的流程,所谓 行为包括设备的操作行为、数据的提取行为、数据的再加工行为;

偏移量计算模块,该模块用来进行偏移量的计算;和

执行模块,用来实现对目标系统进行模拟人类操作流程的自动操作;

输入模块接受以自然语言的描述方式输入的行为、规则和流程;信息采集分析模块采 集目标系统的当前工作状态,并对采集的目标系统的当前工作状态进行分析和量化处理,处 理后的结果由自然语言语义转换模块根据自然语言语义行业百科模块的定义转化为标准的 自然语言描述,转化的同时可选择仍然保留采集分析模块的输出信息;偏移量计算模块将可 直接对比的输出量直接对比,将不能直接对比的输出量根据自然语言语义转换模块输出的反 映当前工作状态的自然语言描述和自然语言语义行业百科模块中记录的数据交换行为、目标 和规则中的相关内容进行比较,并输出比较结果;执行模块以所述比较结果为修正参考,以 模拟用户操作的方式操作目标系统工作。

所述执行模块,包括:

以模拟人类用户操作行为的方式对目标系统进行操作的行为模拟执行器、配合于行为 模拟执行器的操作以实现对目标系统的操作系统进行作用的被操作系统和体现于行为模拟 执行器的操作动作的被操作装置的组合,其中模拟人类用户操作行为即表示,模拟操作行为 的行为流程、分支判断目标和规则、操作结果的数据提取和再加工,需可与自然语言语义行 业百科模块中的记录相关联;和

以信息系统数据方式对目标系统进行操作的信息系统数据发生器;

所述信息系统数据发生器包括以实现等同于行为操作效果的信号模拟器、数据模拟器、 程序执行终端或它们的组合;信号模拟器模拟可产生信号的操作行为所产生的信号、数据模 拟器模拟可产生数据的操作行为所产生的数据、程序执行终端通过直接激活或执行响应的程 序代码来模拟可激活或执行程序的操作行为(例如触发事件、调用函数、启动应用);

行为模拟执行器和信号模拟器、数据模拟器、程序执行终端可单独或者组合的方式协 调工作,可与自然语言语义行业百科模块中的记录关联,以实现对人类用户的任何一种操作 实现完整模拟。

进一步的,所述的输入模块,还包括接受以非自然语言的描述方式输入的行为、规则、 和流程,并将该非自然语言的描述方式输入的流程与通用的自然语言描述进行关联定义,并 将定义结果添加到自然语言语义行业百科模块中。

所述的输入模块,包括:

行为输入模块,用来进行计算机程序代码、流程图、命令行、语音、文字及它们组合 方式的输入;和

信息系统数据流程输入模块,用来输入相当于操作产生的信息系统数据及其流程。

所述的输入模块,还包括:

行为录制及分析模块,用来实现示范性操作的输入,该模块能够自动分析该操作,并 生成行为输入模块的等同效果输出。

所述信息采集分析模块,包括:

用来采集目标系统的声音信息的声音输出采集器和能够对声音输出采集器输出的声音 信息进行识别分析和量化处理的声音识别分析模块;

用来采集目标系统的图像信息的图像输出采集器和能够对图像输出采集器输出的图像 信息进行识别分析和量化处理的图像识别分析模块;

用来采集目标系统的电磁信息的电磁输出采集器和能够对电磁输出采集器输出的电磁 信息进行识别分析和量化处理的电磁识别分析模块;

用来采集目标系统的物理参数信息的物理输出采集器和能够对物理输出采集器输出的 物理参数信息进行识别分析和量化处理的物理参数检测分析模块;

用来采集目标系统的信息系统数据的信息系统数据采集器和能够对信息系统数据采集 器输出的信息系统数据进行识别分析和量化处理的信息系统数据分析模块。

所述偏移量计算模块,包括:

行为偏移量计算模块,用来依据目标状态相对于当前工作状态的差值,结合行为输入 模块输入的、记录在自然语言语义行业百科模块中的操作方法和规则,计算出上一个行为和 目标行为的偏移量;和

信息系统数据偏移量计算模块,用来依据目标状态的信息系统数据与当前工作状态的 信息系统数据的差值,结合行为输入模块输入的操作方法和规则,计算出上一组信息系统数 据和目标信息系统数据的偏移量。

所述执行模块,包括:

以模拟人类用户操作行为的方式对目标系统进行操作的行为模拟执行器、配合于行为 模拟执行器的操作以实现对目标系统的操作系统进行作用的被操作系统和体现于行为模拟 执行器的操作动作的被操作装置,其中模拟人类用户操作行为即表示,模拟操作行为的行为 流程、分支判断目标和规则、操作结果的数据提取,需与自然语言语义行业百科模块中的记 录相关联;和

以信息系统数据方式对目标系统进行操作的信息系统数据发生器。

信息系统数据发生器包括以下三种类型:以实现等同于行为操作效果的信号模拟器、 数据模拟器、程序执行终端或它们的组合。信号模拟器模拟可产生信号的操作行为所产生的 信号、数据模拟器模拟可产生数据的操作行为所产生的数据、程序执行终端模拟可激活或执 行程序的操作行为以激活或执行相关程序(例如触发事件、调用函数、启动应用),三种类 型的发生器以模拟人类用户操作行为的方式对信息系统进行模拟操作。模拟人类用户操作行 为即表示,模拟操作行为的行为流程、分支判断目标和规则、操作结果的数据提取,需与自 然语言语义行业百科模块中的记录相关联。

一种基于自然语言信息转换和行为模拟的数据交换方法,包括:

预置一个自然语言语义行业百科模块,该模块用来将各行业对各类设备,包括计算机 在内的操作行为、规则和流程的描述设置为与对应的自然语言描述相关联;

预置一个自然语言语义转换模块,该模块的作用在于利用自然语言语义行业百科模块 中定义的设备操作行为及规则描述与自然语言描述的关联关系,将输入的设备操作行为及规 则描述、以及各采集设备所采集到的数据,在自然语言以及各设备原本的表述方式之间转换, 以便将各种检测设备的输出参数、各类设备的操作描述、输入、输出及数据处理加工方式方 法以自然语言为媒介形成关联关系,获得行业级的统一信息交换基础;

预置一个行为模拟装置,该装置能够对需要进行数据交换的目标系统以模拟人类操作 的方式进行操作;

在目标系统的数据交换过程中,通过输入关联于自然语言的行为、规则和流程和对目 标系统的当前工作状态的采集,以及将目标系统的当前工作状态的量化数据转化为标准的自 然语言后,利用目标系统的当前工作状态和反映输入基于自然语言的流程的目标行为的差值 计算,校正出偏差,使行为模拟装置以模拟人类操作的方式,不断趋近对目标系统的恰当操 作,并通过上述操作实现对目标系统及多个目标系统间数据的读取或写入。

所述输入基于自然语言的流程包括以自然语言、计算机程序、流程图、命令行方式输 入、信息系统数据方式输入、示范性操作方式输入及这些方式的组合。

所述输入基于自然语言的行为、规则和流程还包括以非自然语言的描述方式输入,并 将该非自然语言的描述方式输入进行与行业通用的自然语言描述的关联定义,并将定义结果 添加到自然语言语义行业百科模块中。

一种基于自然语言信息转换和行为模拟的数据交换方法,包括从第一目标系统读出信 息的过程和将对应的信息写入第二目标系统的过程;

在从第一目标系统读出信息的过程中,包括如下步骤:

A.用自然语言及与自然语言关联的描述方式输入与第一目标系统相关联的操作方法、 规则、流程的步骤;

B.采集第一目标系统当前工作状态的步骤;

C.将采集的第一目标系统当前工作状态转化为自然语言的步骤;当第一目标系统的当 前工作状态为读出有效信息的结果时,结束从第一目标系统读出信息的过程,否则,继续该 过程;

D.以步骤A输入的规则和流程为行为目标,将行为目标与当前工作状态进行比较,并 输出比较结果的步骤;

E.以比较结果为修正参考,结合步骤A中输入的操作方法、规则、流程,以模拟人类 操作的方式,操作第一目标系统工作,直至读取所需信息,并返回步骤A;

在将对应的信息写入第二目标系统的过程中,包括如下步骤:

a.用自然语言及与自然语言关联的描述方式输入与第二目标系统相关联的操作方法、 规则、流程的步骤;

b.采集第二目标系统当前工作状态的步骤;

c.将采集的第二目标系统当前工作状态转化为自然语言的步骤;当第二目标系统的当 前工作状态为写入信息的结果时,结束将对应的信息写入第二目标系统的过程,否则,继续 该过程;

d.以步骤a输入的流程为行为目标,将行为目标与当前工作状态进行比较,并输出比 较结果的步骤;

e.以比较结果为修正参考,结合步骤a中输入的操作方法、规则、流程,以模拟人类 操作的方式,操作第二目标系统工作,直至写入所需信息,并返回步骤a。

所述的步骤D和步骤d中,替换为以人工方式得出比较结果,并将比较结果人工输入 下一步流程。

各种数据交换可由以上两个过程的多次组合协同完成。

本发明的一种基于自然语言信息转换和行为模拟的数据交换装置及方法,是在需要交 换信息的各目标系统中设置采样点;根据采样点类型分别以至少一种的声音输出采集器、图 像输出采集器、电磁输出采集器、物理输出采集器、信息系统数据采集器进行数据采集;采 集到的数据通过对应的识别分析模块进行量化;各目标系统中采集出的量化数据因为开发者 不同,会有不同的描述,因此基于行业规范自然语言进行标准化转换,即转换为人类行业用 户交谈中使用的最接近行业标准用语;标准用语的转换方式方法依据自然语言语义行业百科 模块中记录的方法进行转换;根据自然语言语义转换模块的输出,行为偏移量计算模块根据 行为输入模块、行为录制及分析模块、信息系统数据流程输入模块之一或者它们的组合输入 的行为方法、序列、分支判断规则和目标,计算出当前目标系统工作状态和目标状态之间的 差值;当前目标系统工作状态和目标状态之间的差值修正,可以信息系统数据流程方式输入 行为的,由信息系统数据发生器依据差值向目标系统发送数据请求;不可以信息系统数据流 程方式输入行为的,以行为模拟执行器输入行为,该行为可作用于目标系统的操作系统以及 作用于被操作装置。所有的数据交换行为,参照人工进行交换的模式进行输入。以流程图、 命令行方式输入的通过行为输入模块输入。以示范性操作的方式输入的,以行为录制及分析 模块进行输入。操作行为可以信息系统数据方式直接输入的,以信息系统数据流程输入模块 进行输入。已输入的行为及规则,和自然语言相关联,被自然语言语义行业百科模块所记录, 可被后输入的行为及规则进行调用和重复使用。

与现有技术相比较,本发明的有益效果是:

1、本发明将自然语言信息转换和行为模拟相结合,可以替代人工在各系统间自动进行 数据交换,从而避免人工交换数据时产生的人为错误和人为信息泄露,提高系统的安全性。

2、传统数据交换的主要障碍就是各个应用系统的开发商所使用的编程语言和编程方法 不同,因此各类行业信息就被以正常人无法直接阅读的方式进行存储,本发明将各个应用系 统中对各类行业信息的计算机程序描述转换为人类语言描述,并且考虑到各地行业术语的习 惯称呼、方言等非通用的人类语言描述进一步进行统计记录,这样就可以方便、快捷地实现 在各个信息系统之间以人类语言作为统一标准进行数据交换,因为人类语言的语音、语义、 语法是相对稳定的并且同一语言是容易实现信息交流的。因此系统之间的数据交换在自然语 言语义行业百科模块建设完整的情况下,可直接使用更为稳定的行业百科模块完成数据交换 的设计和实现,不需要再进行接口的编写,可大幅度降低开发工作量。

3、本发明是使用操作方法序列来完成系统中的数据、状态的提取,操作方法与系统的 用户界面关联性较大,而用户界面是系统中相对稳定的部分;同时,由于本发明设计了信息 采集输入模块,用户界面的变动可被信息采集输入模块发现并且矫正;因此,相互交换的系 统中的某个或者多个发生了结构化变更,基本不会影响本方法进行的数据交换成功性。

4、本发明是使用操作方法序列来完成行业信息的计算机程序到人类语言的转换,这种 方法就抛开了计算机程序对数据信息的个性化封装,直接以使用者的使用行为这一可以被人 类通用语言描述并能被普通人理解的方式进行关联记录,由于使用的是人类语言进行关联记 录,因此可以方便的将地区习惯用语、方言也纳入地区标准语义系统,对于个体之间发音差 异化较大的方言,还可以针对每个人记录其方言发音和标准语义之间的关联,从而大大提高 了本发明的适应性,比如,还可用于对各类仪表、开关面板等等非纯信息系统的操作、数据 交换。

5、本发明的输入模块还可以将以非自然语言的描述方式输入的行为、规则、流程与通 用的自然语言描述进行关联定义,并将定义结果添加到自然语言语义行业百科模块中,这就 大大提高了自然语言语义行业百科模块的扩展的方便性,使得自然语言语义行业百科模块可 以在使用过程中不断扩展。

以下结合附图及实施例对本发明作进一步详细说明;但本发明的一种基于自然语言信 息转换和行为模拟的数据交换装置及方法不局限于实施例。

附图说明

图1是本发明装置的构成示意图;

图2是本发明装置的自然语言语义行业百科模块的构成示意图。

具体实施方式

实施例,

参见图1所示,本发明的一种基于自然语言信息转换和行为模拟的数据交换装置,包 括:

自然语言语义行业百科模块4,该模块4的作用在于将各行业对包括计算机在内的各类 设备的操作行为及规则的描述设置为与对应的自然语言描述相关联,以便解决各个业务系统 计算机语言、数据描述及记录方法及专业操作用语不通用时造成的数据交换障碍;

自然语言语义转换模块3,该模块3的作用在于利用自然语言语义行业百科模块4中定 义的设备操作行为、输出结果处置方法及对应规则描述与自然语言描述的关联关系,将输入 的设备操作行为、输出结果处置方法及对应规则描述、以及各采集设备所采集到的数据,在 自然语言以及各设备原本的表述方式之间转换,以便将各种检测设备的输出参数、各类设备 的操作描述、输入、输出以自然语言为媒介形成关联关系,获得行业级的统一信息交换基础;

信息采集分析模块,该模块的作用在于对拟进行数据交换的目标系统的当前工作状态 进行数据采集并将采集的数据进行量化处理,其采集方式、方法、采集序列均按照行业百科 模块中记载的与自然语言描述相关联的设备操作行为、输出结果处置方法及对应规则进行; 以便自然语言语义转换模块可将采集的数据依据自然语言语义行业百科关联的操作规范进 行可被人直接理解的转换;

输入模块,该模块用来输入实现系统间数据交换的包括行为、目标、规则的流程,所谓 行为包括设备的操作行为、数据的提取行为、数据的再加工行为;

偏移量计算模块,该模块用来进行偏移量的计算;和

执行模块,用来实现对目标系统进行模拟人类操作流程的自动操作,以解决基于计算 机语言的自动操作方式只有编程人员可以理解的弊端;

输入模块接受以自然语言的描述方式输入的行为、规则和流程;信息采集分析模块采 集目标系统的当前工作状态,并对采集的目标系统的当前工作状态进行分析和量化处理,处 理后的结果由自然语言语义转换模块3根据自然语言语义行业百科模块4的定义转化为标准 的自然语言描述,转化的同时可选择仍然保留采集分析模块的输出信息;偏移量计算模块将 可直接对比的输出量直接对比,将不能直接对比的输出量根据自然语言语义转换模块3输出 的反映当前工作状态的自然语言描述和自然语言语义行业百科模块4中记录的数据交换行 为、目标和规则中的相关内容进行比较,并输出比较结果;执行模块以所述比较结果为修正 参考,以模拟用户操作的方式操作目标系统工作。

进一步的,所述的输入模块,还包括接受以非自然语言的描述方式输入的行为、规则 和流程,并将该非自然语言的描述方式输入的流程与通用的自然语言描述进行关联定义,并 将定义结果添加到自然语言语义行业百科模块4中。

所述的输入模块,包括:

行为输入模块51,用来进行计算机程序代码、流程图、命令行、语音、文字及它们组 合方式的输入;和

信息系统数据流程输入模块53,用来输入相当于操作产生的信息系统数据及其流程。

所述的输入模块,还包括:

行为录制及分析模块52,用来实现示范性操作的输入,该模块能够自动分析该操作, 并生成行为输入模块的等同效果输出。

所述信息采集分析模块,包括:

用来采集目标系统的声音信息的声音输出采集器11和能够对声音输出采集器输出的声 音信息进行识别分析和量化处理的声音识别分析模块21;

用来采集目标系统的图像信息的图像输出采集器12和能够对图像输出采集器输出的图 像信息进行识别分析和量化处理的图像识别分析模块22;

用来采集目标系统的电磁信息的电磁输出采集器13和能够对电磁输出采集器输出的电 磁信息进行识别分析和量化处理的电磁识别分析模块23;

用来采集目标系统的物理参数信息的物理输出采集器14和能够对物理输出采集器输出 的物理参数信息进行识别分析和量化处理的物理参数检测分析模块24;

用来采集目标系统的信息系统数据的信息系统数据采集器15和能够对信息系统数据采 集器输出的信息系统数据进行识别分析和量化处理的信息系统数据分析模块25。

所述偏移量计算模块,包括:

行为偏移量计算模块61,用来依据目标状态相对于当前工作状态的差值,结合行为输 入模块输入的、记录在自然语言语义行业百科模块中的操作方法和规则,计算出上一个行为 和目标行为的偏移量;和

信息系统数据偏移量计算模块62,用来依据目标状态的信息系统数据与当前工作状态 的信息系统数据的差值,结合行为输入模块输入的操作方法和规则,计算出上一组信息系统 数据和目标信息系统数据的偏移量。

所述执行模块,包括:

以模拟人类用户操作行为的方式对目标系统进行操作的行为模拟执行器71、配合于行 为模拟执行器的操作以实现对目标系统的操作系统进行作用的被操作系统72和体现于行为 模拟执行器的操作动作的被操作装置73的组合,其中模拟人类用户操作行为即表示,模拟 操作行为的行为流程、分支判断目标和规则、操作结果的数据提取和再加工,需与自然语言 语义行业百科模块中的记录相关联;和

以信息系统数据方式对目标系统进行操作的信息系统数据发生器8。

信息系统数据发生器包括以下三种类型:以实现等同于行为操作效果的信号模拟器、 数据模拟器、程序执行终端或它们的组合。信号模拟器模拟可产生信号的操作行为所产生的 信号、数据模拟器模拟可产生数据的操作行为所产生的数据、程序执行终端模拟可激活或执 行程序的操作行为以激活或执行相关程序(例如触发事件、调用函数、启动应用),三种类 型的发生器以模拟人类用户操作行为的方式对信息系统进行模拟操作。模拟人类用户操作行 为即表示,模拟操作行为的行为流程、分支判断目标和规则、操作结果的数据提取,需与自 然语言语义行业百科模块中的记录相关联。

行为模拟执行器和信号模拟器、数据模拟器、程序执行终端可单独或者组合的方式协 调工作,可与自然语言语义行业百科模块中的记录关联,以实现对人类用户的任何一种操作 实现完整模拟。

本发明的一种基于自然语言信息转换和行为模拟的数据交换装置,自然语言语义行业 百科模块4的构成如图2所示,针对每个地区级别应用系统,地区应用标准语义模块将地区 应用系统中的各类信息的提取操作流程、规则予以记录,并关联为基于系统操作序列的标准 语义,假设一个特定的应用系统1(民政某应用系统)中具有地名信息查询的功能,转换到 人类语言就是如下序列:打开应用系统1,登陆,打开查询页面,输入业主名称,在结果栏 中输出的地名信息拷贝出来,就是应用系统1中获取地名信息的方式之一,同时民政应用系 统1中可能存在多种获取地名信息的方式,都将被地区应用1获取地名信息的标准语义进行 记录,类似人类自然语言中的同义词、多个说法,同样的,民政的其他应用系统也有类似的 获取地名信息的多种方法,在各自的地区应用标准语义中都将被汇总记录,这种方法就抛开 了计算机程序对地名信息的个性化封装,直接以使用者的使用行为这一可以被人类通用语言 准确描述并能被普通人理解的方式进行关联记录。

由于使用的是人类语言进行关联记录,因此可以方便的将地区习惯用语、方言也纳入 地区标准语义系统,对于差异化较大的方言,还可以针对每个人记录其方言发音和标准语义 之间的关联。

地区标准语义模块将各个应用系统中的标准语义、地区人类的习惯用语和方言进行汇 总,将表达同一意思的计算机操作行为和人类习惯用语、方言进行关联。行业标准语义模块 又将各个地区的内容进一步合并。而不同行业之间的语义则由自然语言语义行业百科模块进 行合并汇总。

本发明的一种基于自然语言信息转换和行为模拟的数据交换装置,具有电磁输出采集 器13,当做了某信息采集操作后,系统如输出的是电磁类信息,则由电磁输出采集器13收 集反馈;例如,以无线电方式传输信息的系统,当在系统中选择发送某信号时,由发射机发 出对应的电磁波信号就需要电磁采集器进行信息采集。本发明还具有物理输出采集器14, 当做了某信息采集操作后,系统如输出的是物理类信息,则由物理输出采集器14收集反馈; 例如,以信息系统控制的转向系统,当在系统中选择发送某信号时,由转向机构作出的响应 则需要物理参数采集装置获取。本发明还具有信息系统数据采集器15,纯信息系统之间的 通讯,则可由信息系统数据采集器15进行采集;例如在pc机上登陆、输入用户名、密码, 然后打开查询页面,这些操作就使信息系统之间的通讯机制产生一系列数据包,由pc发往 服务器,服务器的输出结果也是以数据包方式发给pc,这些数据包可以用信息系统数据采 集器15进行采集,也可以通过图像输出采集器12由pc的输出画面上进行采集和捕获。

行为录制及分析模块52针对信息系统的操作序列。当用户以录制方式完成获取信息的 行为之后,可自动、半自动的分析用户的一系列操作,分解为行为输入模块或者信息系统数 据流程输入模块的输入,或者它们的组合。

行为输入模块51/信息系统数据流程输入模块53在输入各类行为的时候,需要同时对 行业百科添加相应的关于这些行为的通用标准语义记录。输入的行为流程不是单线程的,是 根据反馈需要不断选择下一步行为的。这些选择的方法需要输入行为偏移量计算模块,该模 块根据输出采集到的阶段步骤,决定下一步执行什么行为来纠正。(每种交换行为的偏移量 计算方法(规则)是不一样的,需要以人工方式在输入行为序列或者信息系统数据流程的时 候输入。属于行为序列或者信息系统数据流程的一部分。)

本发明的一种基于自然语言信息转换和行为模拟的数据交换方法,包括:

预置一个自然语言语义行业百科模块4,该模块4用来将各行业对各类设备,包括计算 机在内的操作行为、规则和流程的描述设置为与对应的自然语言描述相关联;

预置一个自然语言语义转换模块3,该模块3的作用在于利用自然语言语义行业百科模 块4中定义的设备操作行为及规则描述与自然语言描述的关联关系,将输入的设备操作行为 及规则描述、以及各采集设备所采集到的数据,在自然语言以及各设备原本的表述方式之间 转换,以便将各种检测设备的输出参数、各类设备的操作描述、输入、输出及数据处理加工 方式方法以自然语言为媒介形成关联关系,获得行业级的统一信息交换基础;

预置一个行为模拟装置,该装置能够对需要进行数据交换的目标系统以模拟人类操作 的方式进行操作;

在目标系统的数据交换过程中,通过输入关联于自然语言的行为、规则和流程和对目 标系统的当前工作状态的采集,以及将目标系统的当前工作状态的量化数据转化为标准的自 然语言后,利用目标系统的当前工作状态和反映输入基于自然语言的流程的目标行为的差值 计算,校正出偏差,使行为模拟装置以模拟人类操作的方式,不断趋近对目标系统的恰当操 作,并通过上述操作实现对目标系统及多个目标系统间数据的读取或写入。

所述输入基于自然语言的流程包括以自然语言、计算机程序、流程图、命令行方式输 入、信息系统数据方式输入、示范性操作方式输入及这些方式的组合。

所述输入基于自然语言的行为、规则和流程还包括以非自然语言的描述方式输入,并 将该非自然语言的描述方式输入进行与行业通用的自然语言描述的关联定义,并将定义结果 添加到自然语言语义行业百科模块中。

本发明的一种基于自然语言信息转换和行为模拟的数据交换方法,包括从第一目标系 统读出信息的过程和将对应的信息写入第二目标系统的过程;

在从第一目标系统读出信息的过程中,包括如下步骤:

A.用自然语言及与自然语言关联的描述方式输入与第一目标系统相关联的操作方法、 规则、流程的步骤;

B.采集第一目标系统当前工作状态的步骤;

C.将采集的第一目标系统当前工作状态转化为自然语言的步骤;当第一目标系统的当 前工作状态为读出有效信息的结果时,结束从第一目标系统读出信息的过程,否则,继续该 过程;

D.以步骤A输入的规则和流程为行为目标,将行为目标与当前工作状态进行比较,并 输出比较结果的步骤;

E.以比较结果为修正参考,结合步骤A中输入的操作方法、规则、流程,以模拟人类 操作的方式,操作第一目标系统工作,直至读取所需信息,并返回步骤A;

在将对应的信息写入第二目标系统的过程中,包括如下步骤:

a.用自然语言及与自然语言关联的描述方式输入与第二目标系统相关联的操作方法、 规则、流程的步骤;

b.采集第二目标系统当前工作状态的步骤;

c.将采集的第二目标系统当前工作状态转化为自然语言的步骤;当第二目标系统的当 前工作状态为写入信息的结果时,结束将对应的信息写入第二目标系统的过程,否则,继续 该过程;

d.以步骤a输入的流程为行为目标,将行为目标与当前工作状态进行比较,并输出比 较结果的步骤;

e.以比较结果为修正参考,结合步骤a中输入的操作方法、规则、流程,以模拟人类 操作的方式操作第二目标系统工作,直至写入所需信息,并返回步骤a。

所述的步骤D和步骤d中,替换为以人工目测出的方式得出比较结果,并将比较结果 人工输入下一步流程。本发明还可以手工方式实现该方法的部分环节的行为。例如通过目视 方式获取偏移量,然后手工输入偏移量进行执行的方式,仅仅是以人工方式取代了行为偏移 量计算模块,仍然是使用本方法进行数据交换。

各种数据交换均可由以上两个过程的多次组合协同完成。

本发明的一种基于自然语言信息转换和行为模拟的数据交换装置及方法,是在需要交 换信息的各目标系统中设置采样点;根据采样点类型分别以至少一种的声音输出采集器11、 图像输出采集器12、电磁输出采集器13、物理输出采集器14、信息系统数据采集器15进 行数据采集;采集到的数据通过对应的识别分析模块进行量化;各目标系统中采集出的量化 数据因为开发者不同,会有不同的描述,因此基于行业规范自然语言进行标准化转换,即转 换为人类行业用户交谈中使用的最接近行业标准用语;标准用语的转换方式方法依据自然语 言语义行业百科模块4中记录的方法进行转换;根据自然语言语义转换模块3的输出,行为 偏移量计算模块根据行为输入模块51、行为录制及分析模块52、信息系统数据流程输入模 块53之一或者它们的组合输入的行为目标,计算出当前目标系统工作状态和目标状态之间 的差值;当前目标系统工作状态和目标状态之间的差值修正,可以信息系统数据流程方式输 入行为的,由信息系统数据发生器依据差值向目标系统发送数据请求;不可以信息系统数据 流程方式输入行为的,以行为模拟执行器输入行为,该行为可作用于目标系统的操作系统以 及作用于被操作装置。所有的数据交换行为,参照人工进行交换的模式进行输入。以流程图、 命令行方式输入的通过行为输入模块输入。以示范性操作的方式输入的,以行为录制及分析 模块进行输入。操作行为可以信息系统数据方式直接输入的,以信息系统数据流程输入模块 进行输入。

以下用一个具体的数据交换过程来进一步说明。

某市二审法院的审判信息系统和一审法院的审判信息系统以及审判管理系统对于二审 改判发回瑕疵率的相关数据没有实时交换。二审法院录入了认定瑕疵的数据后,一审法院的 审判信息系统在下个月才能读到,此时,审判执行分析系统已经生成二审改判发回瑕疵率, 一审法院无法申诉,影响考评。

依照传统模式,需要开发数据交换软件按照接口访问二审法院审判信息系统获取相关 数据,并在审判管理系统中录入有关二审改判发回瑕疵率的相关数据。以传统方式解决涉及 两个系统的开发商协作问题,工作量大,周期长。现按照本发明的方法说明如何避免接口开 发,基于本方法来完成数据查询和交换方法:

通过行为输入模块输入关于二审改判发回瑕疵率的数据交换过程简述如下:(省略分支 判定细节描述):登录二审法院审判信息系统,按照改判和发回重审的结案方式检索相关案 件,在列表中读取相关案件结案情况的“事由或原因”判断为瑕疵的案件,打开其收立案信 息页面,读取“原审案号”和“原审法院”信息,登录审判管理系统,录入“原审案号”“原 审法院”“结案事由或原因”。

该交换过程可通过行为输入模块以语音、文字、计算机程序代码、流程图、命令行或 者它们的组合方法进行输入。

该交换过程也可以通过行为录制及分析模块,以示范性操作的方式进行录入,即,启 动录制后,手动操作上述交换过程,结束录制后,由行为录制及分析模块产生等同行为输入 模块输出的内容,经人工审核或者直接提交给自然语言语义行业百科模块。

该交换过程也可以通过信息系统数据流程输入模块,直接输入信息系统数据流程。

行为输入模块输入上述交换信息时,自然语义行业百科模块可以人工、半人工和自动 三种方式中的一种核对上述交换信息的语义是否都在自然语义行业百科模块中已有建立,如 果未建立,则要求建立,如果都已建立,则启动自然语言语义转换模块将该交换流程分解为 操作方法、目标、规则。

自然语言语义转换模块将响应操作方法、目标、规则传输给行为偏移量计算模块和信 息系统数据偏移量计算模块。所谓操作方法,是以一次有明显反馈的输入为粒度的操作序列, 例如给出一个鼠标位移的输入,被操作系统的屏幕上出现鼠标图标,图像输出采集器获取图 像,图像识别分析模块计算出鼠标位置,自然语言语义转换模块将自然语言与此位置关联, 使各个模块均能了解鼠标的具体位置,就是操作方法粒度的一种确定方式。基于该操作方法, 偏移量计算模块则可根据数据交换各步骤的目标和规则,选择出合适的下一步操作,直至完 成整个数据交换。例如知道鼠标位置之后,结合图像分析或者数据分析,即可选择出下一步 鼠标移动和点击的具体偏移量,形成下一步操作方法。

后面步骤可由以下方法分别或者组合实现:

方法1:行为模拟执行器通过操作模拟装置,例如,模拟鼠标和键盘的物理设备进行模 拟操作。模拟鼠标发出点击信号,图像采集装置捕捉被操作系统的图像输出,图像识别分析 模块获取鼠标位置信息,发送给自然语言语义转换模块,根据需要转换为各个模块需要的输 入,由行为偏移量计算模块计算出当前鼠标位置与目标鼠标位置的偏差,由行为模拟执行器 按照偏差,驱动模拟鼠标和模拟键盘发出下一步移动、点击、输入,不断重复该流程,直至 完成整个数据交换过程,被交换数据的提取可由图像识别分析模块完成,也可由信息系统数 据采集器通过分析被访问系统发回的数据获得。

方法2:行为模拟执行器访问被操作的终端系统,以模拟程序模拟鼠标键盘进行模拟操 作:例如,通过操作系统的调用得到目标应用程序的句柄、获取相应输入框、输入按钮的 ID,赋予输入框、输入按钮对象相应的值,完成填写、点击的模拟操作。被交换数据的提取 可由图像识别分析模块完成,也可由信息系统数据采集器通过分析被访问系统发回的数据获 得,偏差计算及后继步骤判断与方法1一致。

方法3:信息系统数据发生器的数据模拟器直接模拟浏览器发生上述访问时产生的HTTP 请求相一致的数据包,达到各类鼠标键盘填写、点击同等的操作效果。被交换数据的提取可 由图像识别分析模块完成,也可由信息系统数据采集器通过分析被访问系统发回的数据获 得,偏差计算及后继步骤判断与方法1一致。

方法4:信息系统数据发生器的信号模拟器直接模拟语音信号,发出相关命令模拟操作 (需目标系统具备语音输入能力)。被交换数据的提取可由图像识别分析模块完成,也可由 信息系统数据采集器通过分析被访问系统发回的数据获得,偏差计算及后继步骤判断与方法 1一致。

方法5:信息系统数据发生器的执行程序终端,在该终端上直接激活相关程序或者执行 相关程序。例如登录审判信息系统,就是执行调用审判信息系统login.validate()函数的 程序,完成登录。其它的填写、选择等操作动作也是使用类似方法完成。被交换数据的提取 可由图像识别分析模块完成,也可由信息系统数据采集器通过分析被访问系统发回的数据获 得,偏差计算及后继步骤判断与方法1一致。

上述实施例仅用来进一步说明本发明的一种基于自然语言信息转换和行为模拟的数据 交换装置及方法,但本发明并不局限于实施例,凡是依据本发明的技术实质对以上实施例所 作的任何简单修改、等同变化与修饰,均落入本发明技术方案的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号