首页> 中国专利> 用于访问信息系统的自然语言查询系统

用于访问信息系统的自然语言查询系统

摘要

允许用户(4)与信息系统(1)交互作用的发音交互作用系统(5),该系统目的是连接到信息系统(1),该交互作用系统(5)目的是连接到识别系统(2),该识别系统用于允许用户(4)通过由该用户生成并由识别系统(2)处理的短语与信息系统(1)交互作用,所述交互作用系统(5)包括至少一个域模块(5a),其目的是在其中定义短语设置,该短语设置基于对假定应用域的所述信息系统来说公用的对象类、属性类和动作类构造,并被提供来通过从信息系统(1)提供的特定对象类型、动作类型、属性类型和它们的实例逐一列举,以便定义被提供来由用户(4)生成的短语的语法,从而与信息系统(1)交互作用。

著录项

  • 公开/公告号CN1494713A

    专利类型发明专利

  • 公开/公告日2004-05-05

    原文格式PDF

  • 申请/专利权人 声音鉴析公司;

    申请/专利号CN02805712.0

  • 申请日2002-02-28

  • 分类号G10L15/26;G06F17/30;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人付建军

  • 地址 比利时布鲁塞尔

  • 入库时间 2023-12-17 15:18:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-04-15

    未缴年费专利权终止 IPC(主分类):G10L15/26 授权公告日:20051221 终止日期:20140228 申请日:20020228

    专利权的终止

  • 2013-03-20

    专利权的转移 IPC(主分类):G10L15/26 变更前: 变更后: 登记生效日:20130218 申请日:20020228

    专利申请权、专利权的转移

  • 2005-12-21

    授权

    授权

  • 2004-07-07

    实质审查的生效

    实质审查的生效

  • 2004-05-05

    公开

    公开

说明书

技术领域

本发明涉及目的在于允许用户通过识别系统与信息系统交互作用的交互作用系统。

背景技术

识别系统通常包括两种模块:识别模块,其将由用户生成的短语转换成所述短语的原文计算机表示(textual computerrepresentation),以及正文生成模块,其能将原文计算机表示转换成可由用户理解的生成的短语。在识别系统中,一种即是语音识别系统,通过该语音识别系统,用户能通过发音生成短语并能出声地向用户生成短语,以及正文识别系统,诸如正文扫描系统,通过该系统,用户能通过书写正文生成短语并以书写的形式生成用户短语。

信息系统管理通常存储在数据库中的数据。这些数据库通常由它们的用户定制,以及信息系统目的在于开发所述数据库。

在数据库中,数据,也称为对象,均集合成可由代码识别的对象类型。每个对象类型集合假定类型(considered type)的且为特定数据或对象的对象实例(instance)。每种对象类型与某些属性有关,这些属性具有对象类型的实例的特征。与对象类似,可将属性集合在属性类型中。属性类型组归结于具有相似特征,例如,正文或数据属性。

每种信息系统适合于数据库,它必须操作,并从而可寻址对象类型、属性类型以及具有某些属性实例的对象类型的对象的实例。因此,可由数据库使用来识别对象类型和属性类型的代码可通过必须操作所述数据库的信息系统来识别。

另外,每种信息系统包含集合可由系统应用在数据库的对象上的动作的动作类型(action type)。每种动作类型适合于一个或多个对象类型。

可按应用程序的不同域(domain)聚集信息系统,诸如几何图形信息系统(GIS)、企业资源计划(ERP)系统、文档管理(DM)系统或产品数据管理(PDM)系统,以便命名几个公知的商业应用域。

传统上,特定应用系统的用户必须通过专门为该系统开发的接口来与该系统交互作用,即使在相同的应用域中,每个系统的接口也彼此不同。另外,所述用户将不得不通过使用访问信息系统的计算机的键盘和/或鼠标与信息系统交互作用。

发明内容

本发明通过提供称为语音查询语言的交互作用系统来克服这些问题,这允许用户通过使用不同的预先存在的识别系统,与应用域的不同的预先存在的信息系统交互作用。因此,本发明允许用户通过生成称为查询的短语,将由信息系统定义的动作应用到存储在由信息系统操作的数据库中并由属性来识别。

发明人已经发现对应用域的所有信息系统来说,可定义公用对象类(class)、属性类和动作类。这些类分别集合呈现出用于定义假定类(considered class)的公用特征的对象、属性以及动作,所述特征专用于该域的所有信息系统。对象的相同实例可是几个对象类的一部分,如果它同时呈现出这些不同类的特征的话。基于所述对象、属性和动作类,可定义动作短语(action phrase)设置,这将构成各模块,该模块通过假定应用域的专用信息系统的特定的对象类型、属性类型和动作类型,以及使其属性实例存储在由所述信息系统处理的数据库中的对象的实例来逐一列举(particularise)。因此,用来构建实际短语的被引用的动作短语设置定义实质上由对象类型、属性类型和动作类型组成的语法,以及提供产生式规则(production rule)以用在用户与假定域的信息系统的交互用作中,当该系统呈现给用户他所请求的不同查询以及当用户向该信息系统访问这样的查询时。

因此,本发明提供用于允许属于相似信息系统的应用域的信息系统的用户与所述信息系统交互作用的交互作用系统,所述交互作用系统目的在于连接到该信息系统,该交互作用系统进一步的目的在于连接到用于允许用户通过由所述用户生成并由识别系统处理来与该信息系统交互作用的识别系统,所述交互作用系统包括至少一个域模块,其目的在于在其中定义短语设置,所述短语设置是基对假定应用域的所述信息系统公用的对象类、属性类和动作类构造的,且被提供用以通过从该信息系统提供的特定对象类型、动作类型、属性类型和它们的实例逐一列举,以便定义被提供来由用户生成的短语的语法,从而与信息系统交互作用。

最好,根据本发明的交互作用系统包括连接到至少一个域模块并且其作用在于连接到识别系统的类属模块(generic module),所述类属模块用于将能由用户生成的所述短语转换成可由识别系统使用的原文计算机表示,所述识别系统用于识别用户生成的所述短语并用于在已经发生识别由用户生成的短语时,将由该识别系统生成的原文计算机表示转换成由所述语法定义的短语。

最好,所述类属模块包括含有允许构造该识别系统的信息的元素。

在根据本发明的交互作用系统的另一优选设置中,该系统包括适配器模块,该适配器模块连接到至少一个域模块并用于连接到该信息系统,所述适配器模块用于从信息系统抽取对象、属性、动作类型和它们的实例,并将它们传递给至少一个域模块并用于为后者驱动该信息系统来执行用于包含在由用户生成的短语中的动作的请求。

最好,至少一个域模块包括含有有关对象的一般概念(notion)和用于识别对于几个应用域来说公用的对象的属性的信息的元素。

最好,至少一个域模块的目的在于连接到用来定义对象类、属性类、动作类以及短语设置的系统分析员和语言学家,所述至少一个域模块目的在于在其中定义该短语设置。

最好,上述识别系统是语音识别,以及由用户生成的短语是由所述用户通过发音生成的。

这使得用户通过所述用户的自然语言与信息系统交互作用。

替代地,所述识别系统是正文识别系统,以及由所述用户书写由该用户生成的短语。

附图说明

现在将参考图1来更详细地描述本发明,图1表示在其环境中集成的根据本发明的交互作用系统。

具体实施方式

参考图1,包括根据本发明的交互作用系统的环境由下述元素组成:

1:信息系统,其目的在于操作几个对象类型,该对象类型的特征是具有为属性类型的部分的几个属性,通过几个动作类型来执行所述操作。对象和属性类型具有可在由信息系统操作的数据库中找到的实例。

2:识别系统包括两个模块:

2a:识别模块,将由用户生成的短语转换成正文计算机表示。

2b:正文生成模块,能将正文计算机表示转换成可由用户理解的生成短语。

3:系统分析员和语言学家,用于提供对象、属性和动作类以及短语设置,该短语设置将用来在对象类型上应用信息系统动作。系统分析员和语言学家是能分析用户如何用声音询问该系统的人。分析结果将是通常为应用域的动作短语设置的集合。

4:用户将通过由短语设置定义的语法使用该系统,通过由信息系统操作的对象、属性和动作的实例逐一列举该短语设置。

5:根据本发明的交互作用系统,目的在于允许用户以生成的短语与信息系统交互作用,所述系统必须基于上述逐一列举的短语设置处理生成的短语。该系统包括三个模块:

5b:类属模块,其能把语言语法转换成可由识别系统使用的计算机表示,该语言语法是根据与信息系统的交互作用,能由用户生成的有效短语的一组对象类型、动作类型和产生式规则,该计算机表示可由识别系统使用,且该类序模块能把由识别生成的计算机表示转换成由语法定义的短语。所述类属模块包括含有允许设置识别系统的信息的元素c1,即:

-所使用的识别系统,

-所使用的语言,

-所使用的通信装置,诸如麦克风或电话装置。

5a:域模块,其能将元素接受作为对象类型、属性类型和动作类型、以及可由预定应用域的信息系统操作的后者的实例。域模块包括通常是所述域、并用来将所接收的上述元素与上述动作短语设置结合以产生类属模块5b所需的语法的对象、动作和属性的类的定义。从系统分析员和语言学家接收动作短语设置以便能由用户以自然语言生成查询。如果多个信息系统同时可用,则可生成并激活多个语法。根据本发明的交互作用系统可在信息系统间切换。可在用于域,诸如GIS的根据本发明的交互作用系统和用于另一个域,诸如DM的根据本发明的交互作用系统间进行相似的切换。域模块也可采用在发生识别后由类属模块生成的短语并在将由信息系统1执行的通过特定属性值识别的特定对象上生成动作说明。上述定义可包括在域模块的元素c2中,其包含:

-对几个域来说是公用的信息,诸如对象的一般概念以及用于识别对象的属性。

-域标识,包括用于识别信息系统,诸如GIS信息系统的域的配置元素。

-属于该域的对象类。每个类表示具有公共特征的一组对象。例如,在GIS应用中,对象类,诸如表面类(国家、郡)、线性类(河流、街道)、点状类(城市)、图形类(地理上引用的航空摄影,地图)。实际对象可是几个对象类的部分。例如,在GIS域中,典型对象,诸如城市街道将属于可显示对象类、可选择对象类、空间对象类以及线性对象类。

-可应用于对象类的动作类。实际上,对一个给定域,可定义与每个对象类有关的可应用于那个对象类的动作类。例如,在GIS域中,能显示或隐藏属于可显示对象类的对象,可将属于空间对象类的对象投影到地图上或与属于相同类的另一对象交叉,可选择或取消选定属于可选择对象类的对象,可移动属于线性对象类的对象一定距离以便提供特定的位置。不管是何种特定对象类和实例,总是可操作(显示、选择、高亮,...)由另一平面对象包含的点状、线性和平面对象,操作由线性对象交叉的平面对象,或操作沿某一给定线性对象的点状对象。

-可连接到对象上的属性类。属性类集合对所有对象类的对象来说具有公共意义的属性。即,属于“实例命名”类的属性可用来识别对象类型的特定实例。例如,在GIS域中,道路具有为“路号”的属性,其实例为数字。因此,“路号”是“数字”属性类型,而且是属性类“实例命名”的部分,因为可按语音通过它们的号码引用道路。

-各种短语设置可用来请求执行动作。可定义与每个动作类有关的一组短语设置,可使用短语设置来请求将完成的类动作。例如,在GIS域中,能定义短语设置,诸如,显示“xyz”或转到“abc”。关于“xyz”或“abc”,可注明用来识别将在其上执行动作的对象类型的属性类。可通过属于由将与用户交互作用的信息系统操纵的这些类型的对象的实例逐一列举这些设置。此外,某些动作,象“显示”或“转向”能具有可易于与原始术语互换的同义词。这表示可存在相同短语设置的多种变形,而其语法结构基本上不变。

-按顺序汇编的术语元素(term element)通过将由用户生成的短语组成。一种称为静态术语元素,其实例不需要从信息系统抽取,诸如号码、比较运算符,以及动态元素,其实例需要从信息系统抽取,诸如那些对象类型或属性类型。静态定义的术语元素是术语的直接列表,其元素可以是在域模块设置期间预定的。

这些元素的每一个可标记为可选的,这表示可从生成忽略它们而不会损害短语的含义,诸如敬语表达(politeness expression)。

这些元素的每一个也可标记为可重复的,标记为由数值、拼写标识代码或特定的地理位置组成。

例如,在GIS域中,可具有下述静态术语元素的序列:[-1][2][+3][-4],其中,[-1]标记由术语“please”和“canyou”组成的可选术语列表,[2]标记由“pan to the”或“moveto the”组成的强制(obligatory)术语列表,[+3]标记由术语“north”、“east”、“west”、“south”组成的重复术语列表,[-4]标记由术语“please”组成的可选术语列表。因此,下述是基于这些元素有效短语:pan to the north east,can you move to thesouth south east please。

也可构建短语,诸如[1][2][3]和[1][4][3][5][2],其中[1]是“show”或“display”,[2]是相关的对象实例名,[3]是空间对象类型名,[4]是“the”,[5]是“of”。[2]和[3]是动态术语元素。然后,如果从信息系统抽取的动态元素是称为城市和州的两个空间对象,以及用于城市的称为New-York和Washington和用于州的称为New-York和Idaho的两个实例名,那么组合生成将生成下述短语:

[1]  [2a]  [3a]

[1]  [2b]  [3b]

[1]  [4]   [3a]  [5]  [2a]

[1]  [4]   [3b]  [5]  [3b]

其中

[2a]将为New-York或Washington

[3a]将为城市

[2b]将为New-York或Idaho

[3b]将为州

这产生特定短语,诸如“show New-York city”或“displaythe state of Idaho”。

5c:为专用信息系统应用而创建的信息系统适配器模块。该适配器模块是的目的在于从假定信息系统抽取对象、属性和动作类型以及它们的实例并将这些传递给域模块5a,在域模块5a,在定义信息系统域的对象、属性和动作类中引用它们。另一方面,所述适配器模块能驱动信息系统以便它执行用于包含在由用户生成的短语中的动作的请求。这要求适配器模块将由域模块5a提供的动作说明转换成信息系统的应用逻辑。

上述定义的环境的不同元素间的信息的传送如下:

-从5b至2a:字列表以及产生式规则的定义,该产生式规则管理将这些字组合到适合识别系统的计算机表示中可接受的短语。

-从2a至5b:适合识别系统的计算机表示中的已识别短语。该短语对应于字的有效序列。

-从5b至2b:将被出声地读出给用户的正文计算机表示。

-从5a至5b:一组术语列表,以及利用该术语列表来构建表示可由用户生成的有效短语的短语设置的一组组合规则。

-从5b至5a:由用户生成的、被分解成具有相关术语列表的标识的组合规则标识的短语,以及由用户生成的术语列表项。

-从5c至5a:包括具有其相应的类的对象类型、对象实例、以及具有其相应的类和属性实例的属性类型的列表。

-从5a至5c:具有将由信息系统执行的相关参数的动作。这些参数可包括对象和属性实例。在其中可由相同的用户命令存取两个不同动作或两个不同对象的不确定的情况下,通过域模块将不同概率返回给信息系统,期望适配器模块将能使用信息系统上下文信息或通过要求用户反馈来消除不确定性。

-从1至5c:同从5c至5a,但按逻辑语言1,因此依赖于1。

-从5c至1:同从5a至5c,但按逻辑语言1转换,从而依赖于1。

使用根据本发明的交互作用系统隐含下述事件序列:

-识别域,其重组信息系统的类的公用对象、属性和动作类。

-系统分析员和语言学家3定义对象、属性和动作类以及该域所需的相关动作短语设置。

-将信息编码成可由域模块5a使用的内部格式。

-为属于所识别的域的专用信息系统1定义适配器模块5c。

-用户4启动信息系统。

-信息系统启动适配器模块。

-适配器模块使用信息系统来抽取可由用户使用的对象并将该信息传递给域模块。

-域模块使用上述对象类、属性类和动作短语设置来构建术语列表以及用于类属模块5b的组合规则。

-类属模块将术语列表和组合规则转换成识别系统可接受的形式并启动该识别系统。

-用户生成短语。

-在识别似是而非的短语后,识别系统2将所识别的短语返回给类属模块。

-类属模块将该短语再解析成组合规则和术语列表并将其传递回域模块。

-域模块报告所需信息以便执行适配器模块的动作。

-然后适配器模块呼叫信息系统来执行该动作。

由根据本发明的交互作用系统处理的信息的分类的例子允许用户与GIS域信息系统交互作用:

具有能通过适当值或通过空间关系显示或选择空间对象的信息系统。

具有与该系统有关的为国家和城市的对象类型;这些对象类型的对象的实例具有为名称或人口的两个相关的属性。名称即为正文属性类型,人口即为数值属性类型。

对国家来说,具有两个实例,U.S.A和France。

它们各自的人口数为250000000以及60000000的居民。

对城市来说,具有六个实例,New York、Los Angeles、Dallas、Paris、Lyon、Marseille。

它们各自的人口为1200000、10000000、500000、6000000、1000000、800000的居民。

在English语言中,可定义下述短语以由系统存取对象:

Generic display/hiding operations:

  Display the countries

  Hide the countries

  Display the cities

  Hide the cities

Global selection operation:

  Select all the countries

  Select all the cities

Naming attribute selection operation

  Select the country named France

  Select the city named Los Angeles

Attribute condition expressions:

  Having U.S.A as name

  With a population exceeding 1000000

Attribute related selection

  Select the country which name is U.S.A

  Select the city with a population of 12000000 inhabitants.

Spatial condition expressions:

  Within the U.S.A.

Spatial related selection:

  Select the cities within the U.S.A

  Select the country wherein lies Paris

因此,将定义用于该系统的域模块的c2元素的下述配置项:

域定义

    域X

对象类

    可显示对象

    可选择对象

    空间包围对象

    空间封闭对象

    数值判别对象

    实例命名对象

动作类(例子)

  对可显示对象:

    显示(向用户呈现该对象)

    隐藏(对用户屏蔽该对象)

  对可选择对象:

    选择所有(选择对象)

    取消选定(取消选择对象)

属性类

    命名属性的对象实例

    可查询属性

属性类型

    数值属性

    正文值属性

动作短语设置

  列出所有(“List all countries”,“List all cities”)

  选择所有(“Select all countries”)

  条件(“With a population exceeding 5 million”)

术语元素序列(例子)

  条件命令=[1][2][3][4][5]

动态术语元素

  [3]:可查询数值属性,诸如“人口”。

静态术语元素

  [1]:With|Having

  [2]=a

  [4]=小于|大于|等于

  [5]=数值

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号