首页> 中国专利> 为选定用户群在多个数据源中搜索的工具和方法

为选定用户群在多个数据源中搜索的工具和方法

摘要

本搜索方法包括定义至少一个文档内容阅读格栅(V)的方式,该阅读格栅(V)特定于一选定用户群并且包括至少一个取决于每一数据源(12)的元数据(M)结构的文档内容类别,和使用如此预定义的特定阅读格栅(V)在多个数据源(12)中进行的为所述用户群的利益的文档内容搜索中作为搜索和/或显示格式过滤器的方式。

著录项

  • 公开/公告号CN101218585A

    专利类型发明专利

  • 公开/公告日2008-07-09

    原文格式PDF

  • 申请/专利权人 空中客车公司;

    申请/专利号CN200680025162.4

  • 申请日2006-07-05

  • 分类号

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人郭思宇

  • 地址 法国布拉尼亚克

  • 入库时间 2023-12-17 20:28:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-08-27

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20101006 终止日期:20130705 申请日:20060705

    专利权的终止

  • 2010-10-06

    授权

    授权

  • 2008-09-10

    实质审查的生效

    实质审查的生效

  • 2008-07-09

    公开

    公开

说明书

技术领域

本发明涉及为一个选定用户群在多个数据源中的信息搜索,尤其是涉及为所述用户群在无共同数据结构的不同类数据源中的搜索。

本发明在搜索和知识管理(Knowledge management)领域内为一个用户群找到了它的普遍应用,该用户群具有同一职业(métier)、同一个兴趣核心或同一专业知识,并且希望在多个数据源中搜索信息。

背景技术

人们已经了解按照文档类别和/或按关键词的搜索工具。

通常情况下,这些类别是手工预定义的或是在搜索时很快建立的。

在所用类别最常是太普通且并不相关的情况下,搜索结果的关联性相对不足,尤其是对于拥有尖端的专业知识的用户群。

发明内容

本发明解决了这种不便。

本发明旨在提供一个使用特定于一个或多个选定用户群的预定的阅读格栅(des grilles de lecture)的搜索工具。

它因此,为一个给定用户群,提供一种支持和协助以搜索对于其职业或其兴趣核心相关的信息。

它还旨在优化搜索结果的显示,以便根据特定且预定的阅读格栅方便阅读。

最后它旨在根据一种相对于现有技术的搜索工具而言更令用户群满意、更改善搜索时间以及阅读所述搜索结果的时间的分类来显示文档。

因此,本发明建立在一种搜索方法,用于在多个数据源中搜索供至少一个选定用户群使用的信息内容,每一数据源具有根据一选定结构构建的元数据。

根据本发明的一个概括定义,该方法包括定义至少一个阅读格栅的方式(mode),所述阅读格栅特定于一个用户群并具有取决于每一数据源的元数据结构的至少一个搜索结果类别,和利用该预定义的特定阅读格栅作为在该多个数据源中为所述用户群进行的搜索中的搜索和/或显示格式过滤器的方式。

这样一种方法优势在于可在大量重要且不同类的信息中迅速找到相关的文档。其结果是赢得搜索及阅读时间,并且提高搜索结果的相关性。

在实际中,此阅读格栅包括根据一选定的等级关系排列的多个类别。

根据一种实现方式,定义阅读格栅的方式包括以下步骤:

a)根据用户群的用户共有的至少一个元素,定义至少一个用户群;

b)根据与数据源和/或与所述群有关的至少一个参数,为如此定义的用户群定义至少一个数据源;

c)为如此定义的数据源,搜索可定义至少一个类别的至少一个元数据;

d)对元数据进行有效搜索的情况下,定义该类别和如此获得的元数据之间的至少一个对应规则;

e)将如此定义的对应规则运用到至少一部分数据源信息内容中,并将符合所述对应规则的文档的内容与所述类别相关联;并且

f)为每一数据源的至少一些元数据重复步骤a)至e)并获得至少一种类别,其取决于每一数据源的元数据结构,并且为所述多个数据源形成一个特定于所述用户群的预定义阅读格栅。

实际中,数据源是不同类的。

例如,数据源属于包括内部数据库、外部数据库、内部知识管理应用程序、文档管理应用程序、供应商内容的组。

根据一种实现方式,一个用户群的共同元素属于包括兴趣核心、项目、工具、数据库、过程、方法、职业、专业知识的组。

根据本发明的另一方面,定义所述特定且预定的阅读格栅的方式通过一个放置在选定用户群和所述多个数据源之间的唯一存取模块来实施。

又根据本发明的另一方面,与数据源有关的参数来自于对用户群的职业分析。

本发明的目的还在于一种包括搜索服务器的搜索工具。

根据本发明的另一方面,搜索服务器包括:

-存取模块,用于接收来自一个用户群的请求并适于将搜索结果传送给所述群的用户;

-多个数据源,其中每一个具有根据一选定结构构建的元数据并且分别被连接到一存取模块;

-预先定义至少一个特定于所述用户群的、且具有至少一个类别的阅读格栅(V)的模块,该类别取决于每一数据源的元数据结构;和

-搜索模块,适于使用所述预定义的特定阅读格栅作为在多个数据源中为用户群进行的搜索中的搜索和/或显示格式过滤器。

在实际中,定义模块为至少一个给定用户群包括:

-用于为至少一个数据源搜索可定义至少一个类别的源的至少一个元数据的装置;

-处理装置,在对元数据进行有效搜索的情况下适于:

·  定义在类别和如此获得的元数据之间的至少一个对应规则,将如此定义的对应规则应用到至少一部分数据源的搜索结果上,并将符合所述对应规则的搜索结果与所述类别相关联;并且

·  为每一数据源的至少一些元数据进行重复处理以获得一个特定的搜索和/或显示格栅,该搜索和/或显示格栅可应用到多个数据源并且包括至少一个取决于所述数据源的元数据结构的类别。

本发明同样旨在一种信息系统可读的信息载体,必要时全部或者部分地可拆卸,尤其是CD-ROM或磁载体,如硬盘或软磁盘,或者是可传送的载体,如电或光信号,包括计算机程序的指令,当所述程序被信息系统加载并执行时,可实现前面提及的搜索方法。

本发明最后旨在存储在信息载体上的计算机程序,所述程序包括指令,当所述程序被信息系统加载并执行时,可实现前面提及的搜索方法。

附图说明

本发明的其他特征和优势根据以下详细描述及附图将更加明显,其中:

-图1以图解形式显示可使根据本发明的搜索方法实施的一种安装结构;

-图2以图解形式说明根据本发明的搜索方法的基本功能;

-图3是说明根据本发明定义预定的且特定的阅读格栅的模块的步骤的程序框图;并且

-图4A和4B图解说明根据本发明的阅读格栅和使用这样一个格栅在选定数据源中进行的搜索中作为搜索和显示格式标准的例子。

具体实施方式

参考图1,搜索方法包括一个具有多个模块的搜索服务器2。一个存取模块3可接收来自一个群6的用户的请求4。存取模块3将搜索结果8通过传统技术的微型计算机10类型的信息工具传送给所述群的用户。

存取模块3被放置在用户群6的微型计算机10和多个数据源12之间,其中每一个数据源具有根据选定结构构建的元数据且每一个都被连接到存取模块3。

数据源12可成为供应商内容12A、知识管理的应用程序12B、文档管理的应用程序12C、知识源12D、内部职业库12E。

如上指出,数据源12此处是不同类的,换而言之它们不必具有一个共同的数据结构。

例如,数据源是“Oracle”,“DB2”,“Lotus”,“Verity”,“Filnet”,“Windchill”,“Plumtree”,“SAP”(商业名称)类的。

如我们随后将更详细地看到,搜索工具可在多个数据源12或在其中一个数据库12的子集中搜索。

如我们随后将更详细地看到,根据本发明搜索工具构成一个用于选定用户群的匹配存取工具(步骤E1,图2)。

搜索工具通过提供特定于该群且预定的阅读格栅还构成一个补充关键词的搜索助手(步骤E2,图2),该阅读格栅在通过类别和关键词进行的搜索过程中很可能被用作过滤器。

搜索工具还可以在属于不同类源中的选定数据库中搜索文档(步骤E3,图2)。

搜索工具同样可以,由于阅读格栅,提供表示重要(significative)相关性的有保证的搜索结果(步骤E4,图2)。

最后,由于特定的且预定的阅读格栅,这些搜索结果借助于使用所述阅读格栅分类以改善的可视化效果有组织地显示出来(步骤E5,图2)。

参考图3,根据本发明的搜索使用一种定义特定于一选定用户群的文档内容的阅读格栅的方式。

如我们随后将更为详细地看到,该阅读格栅包括一类或几类文档内容,该文档内容根据依照对其进行搜索的每一数据源的元数据结构定义、选定的等级关系被排列。

如前所见,搜索工具将在多个数据源中以类别和关键词进行的文档内容搜索中,补充关键词地使用这些预定义的且特定的搜索格栅作为搜索和/或显示格式过滤器。

参考图3,该方法首先定义一个用户群(步骤E10)。群的这一定义步骤是根据兴趣核心、项目、工具、数据库、过程、方法、职业、专业知识或是该群全体用户的一个共同属性标准而实现的。

因此,群被定义成一组分享兴趣核心、项目,使用数据库、工具、方法或过程的人。

对一个在步骤E10结束后如此定义的群,事先考虑到识别或定义至少一个数据源(步骤E12)。此识别根据一个与所述源和/或群有关的参数实现,例如在一职业分析之后(步骤E11)。

从如此识别后的数据源12,有可能推导出相应的数据库,步骤E13。

依照群的兴趣核心,有可能推导出某些已经存在的潜在阅读格栅V(步骤E14),又被称为视点(viewpoint)。

阅读格栅或视点V由按照根据数据库和/或数据源12的元数据M的结构演绎的树状结构或树形、按等级状分类的类别T组成。

该方法因此实现可能被群使用或已被使用的数据库12的一个清单或目录。

在步骤E14之后,本方法推导出属于来自用户群兴趣核心的潜在阅读格栅V的类别T(步骤E15)。

对于如此定义的数据源(步骤E16),预先考虑了搜索(步骤E17)可定义至少一类T文档内容的至少一个元数据M。

在对元数据进行有效搜索(肯定测试,步骤E18)的情况下,我们定义至少一个在类别T和如此获得的元数据M之间的对应规则。

得益于对数据库(表,结构)的元数据结构的了解,本方法识别可用域。

此处本方法在于识别可对应于一个或几个类别T的元数据M。若元数据M不可用或不可靠(否定测试,步骤E19),我们借助于对应规则E识别其他元数据M以推导出相应元数据。

这些对应规则E可以是简单或普通类型的(步骤E21),在其中我们使用被正确赋值的域。

对应规则E可更为复杂(步骤E22),其中对应规则E借助于其他域或其他元数据M被推导出。

因此,若元数据M存在,我们根据简单或复杂的对应规则E使用域值或此数值的一部分。

如随后将更为详细地看到的,这些对应规则E借助于一被称为查询构建控件集(query builder)的管理工具被建立起来。

在由群C确认这些对应规则E(供选择的步骤E23)后,我们获得被称为阅读格栅V、视点或viewpoints的一组类别T,其依照选定的、根据元数据结构推导出的等级关系彼此排列。

我们对于每一个类别T(步骤E24)在每个数据库12中(步骤E25)重复进行这一操作。

在检查了全部数据库12之后,阅读格栅V对于用户群6被确认有效,步骤E26。

有时会发生步骤E20的情况,对于当前数据库12,没有任何一个阅读格栅V被定义(步骤E27)。

每一个数据库12因此被重新检查以识别可定义每个类别T的域M。为此我们使用数据库结构的知识,必要时,借助于该数据库的职业或信息代理(représentant)。

由根据本发明的方法处理的数据模型是关系数据库类型的。例如,参考图1,一个用户群6支配多个数据源12,在该数据源上连接特定于每个库12的适配器(未显示)。每个用户群6支配阅读格栅V或viewpoints,其充当搜索过滤器和/或显示重组标准。对应等式E和对应规则被一个称为查询构建控件集(query builder)的管理工具定义和生成。用户请求4因此也将被当作显示或过滤器使用。这些请求或查询因此根据库12中建立的等式被处理。

一部分数据库12可被使用。这部分还被称作报告(report)。

还被称为映射规则(mapping rules)的等式E是定义类别T的普通或复杂的对应规则组。如前所见,一个阅读格栅V是树状结构的一组类别T。这些等式可便于在数据库结构改变和衍变的情况下对它的维护。

在实际中,对应规则根据与用户群6有关的数据、与数据库12有关的数据、与阅读格栅V有关的数据以及必要时与数据库子集有关的数据被计算。属于一个阅读格栅V的每个类别T(图3)借助于一个或多个元数据M,根据待检验的条件以及运算符被定义。这些运算符可以是布尔运算符与、或、“等于”或“不等于”。

参考图4A和4B,我们图解说明根据本发明的阅读格栅和使用这样一个格栅在选定数据源中进行的搜索中作为搜索和显示格式标准的例子。

参考图4A,我们图解说明使用根据本发明参照图3定义的一个阅读格栅V(moteurs)的搜索的一例。

首先,一个关键字MC被定义。此处关键字MC是“fuel flow”。用户随后选择一个阅读格栅,此处是viewpoint V等于“moteurs”。这一阅读格栅V此处包括两个主要类别“Rolls Royce”和“CFMI”。类别“Rolls Royce”包括子类别“Trent 500-A340”,“Trent 700-A330”和“Trent 900-A380”。

此处用户群6是被称为“fadec”的群并且数据源12从数据库“RTN”,“FTA”,“fadecDB”和“ISAIM”中被选出。

这里,群用户选择类别T=Trent 500-A340。

这里,用户的请求因此包括关键字MC,连接其对应规则E的阅读格栅V,该对应规则E将指向由其自身选定的数据库12,这里数据库12=RTN。

得益于定义一部分阅读格栅V的对应规则E,RTN文档以及域M1=ATA和M2=AC_model将被使用。

为群6=fadec在数据库12=RTN中用阅读格栅V=moteurs在类别T=Trent 500-A340中进行搜索。

对应规则可根据由查询构建控件集(query builder )建立的等式关联符合条件M1=ATA(以7开头或等于80),以及域M2=AC_model等于340-541或AC_model等于340-642的所有文档。这一等式在搜索服务器中以XML文本格式实施。

参考图4B,数据库12(RTN)包括多个文档,尤其是6个文档D,分别从D1到D6。阅读格栅V因此可实现类型V=moteurs和数值T=Trent 500-A340的一个搜索标准。我们知道此数值T=Trent500-A340符合以7开头的元数据M1=ATA或等于80的M1=ATA,或者以340-541开始的M2=AC_model或等于340-642的M2=AC_model。

搜索结果使4个文档显示出来。当关键字“fuel flow”没有被显示在文档D3中时我们见到文档D3被删除,文档D1也同样被删除,其中的域M1(ATA)没有以7开头或不等于80,而是此处等于24。

很明显,符合本发明的阅读格栅V可用于多个用户群。同样地,一用户可把多个阅读格栅组合起来作为搜索标准。

关于搜索结果的显示,符合本发明的阅读格栅还给用户提供一个来自所述阅读格栅的显示格式。例如,参考图4B,我们可依照阅读格栅“fonction”,“ATA”,“moteurs”给搜索结果分类。由此得到特定于该用户群的更相关的搜索结果分类。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号