首页> 中国专利> 描述供利用的商务和技术信息的方法

描述供利用的商务和技术信息的方法

摘要

一种数据处理方法,此方法可包含将至少一个描述符维数与数据项相关联。描述符维数可代表在至少第一主题和第二主题之间的一个标度。此维数值可与描述符维数相关联以表征第一和第二主题间的定量关系。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-12-28

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20060510 终止日期:20101027 申请日:20031027

    专利权的终止

  • 2006-05-10

    授权

    授权

  • 2004-08-25

    实质审查的生效

    实质审查的生效

  • 2004-06-16

    公开

    公开

说明书

技术领域

本发明涉及数据处理领域,并且更具体地,涉及描述信息以用于检索和利用的方法。

背景技术

通常的搜索引擎允许用户定位数据项集合中与具体搜索标准相匹配的数据项。通常,搜索引擎将用户指定的查询与描述符的索引进行匹配。描述符,有时称为元数据,提供数据的定义或描述。描述符可与数据项相关联,并且从而可用来为与描述符相关联的数据项提供可搜索的描述。比如,描述符可与各种数据项相关联,如硬件配置文件、数据条目、多媒体文件、文档、绘图、图表、电子表格、软件对象、记录、Web站点、Web网页或任何其他电子文档和/或可以是搜索集合的一部分的软件成分。

数据项可以与大量描述符相关联。与此类似,每个描述符可以与大量数据项相关联。描述符一般是说明单个字词或短语。然而,单个字词或短语经常不传递数据项本质或提供数据项的完全描述。将数据项与一个以上的描述符相关联可能不会传递数据项与每个单个的描述符相关联的程度。结果,对数据集合搜索与具体特征集相匹配的数据项可以是挑战性的。

用户指定的查询通常使用选择的关键词作为搜索词语。搜索词语可加权而更强调具体的搜索词语。某些搜索方法根据搜索词语在用户查询中的位置赋予重要性而隐含地对搜索词语加权。例如,在用户查询中指定的第一个词语可被赋予最高的重要性,而查询中最后词语可被赋予最低的重要性。其他的搜索方法允许用户直接指定搜索词语的权重。

然而,研究表明,用户并不特别善于确定查询词语的相对重要性。一个原因是用户常常不了解在给定的文档集合中存在的描述符的种类,或至少不了解可用描述符的范围。另外,在多数用户寻找关于不熟悉的主题的信息时,用户多半不熟悉在咨询所搜索的主题时最适合的和/或最常用的术语。因此,用户可能会对不相关的词语给予很大的权重,而却对高度相关的词语给予很小的权重。

发明内容

此处公开的本发明可提供一种用来描述、搜索和管理数据集合的解决方案。可使用几组描述符来描述数据项的潜在应用、数据项的特征和内容以及数据项的使用和运用历史。各种描述符组中的每一个都可以用来对数据项集合进行搜索和索引。不过,历史描述符,也可用来管理数据项。

本发明的一个方面可包含一种数据处理方法。此方法可包含将一个或多个描述符维数与集合的数据项相关联。描述符维数中的每一个都代表在至少第一主题和第二主题之间的一个标度。这些主题可将数据项的潜在应用互相关联。根据一实施例,第一和第二主题可彼此相反。对描述符维数可赋予一个维数值。此维数值可表征数据项与描述符维数的第一和第二主题间的定量关系。特别是,描述符维数和维数值可通过使用一组问题向用户查询而确定,其中的问题与关联数据项的描述符维数及维数值相关联。

此方法还可包含对一个或多个数据项赋予一个特征描述符。此特征描述符可说明数据项的功能或数据项内容,如声频段、视频段等等。对历史描述符也可赋予一个或多个数据项。历史描述符可说明使用历史、共享历史、复制历史和/或修改历史。历史描述符还可指定数据项的拥有者。因此,此处公开的描述符可由搜索引擎使用于响应用户查询而选择数据项。

本发明的另一个方面可包含一种搜索数据项集合的方法。此方法可包含通过使用一组问题向用户查询。问题可与同数据项相关联的描述符维数和维数值相关联。描述符维数可代表在至少第一主题和第二主题之间的一个标度;并且此维数值可表征数据项与描述符维数的第一和第二主题间的定量关系。可根据用户对问题的响应生成查询。此查询可指定一个或多个描述符维数和相关联的维数值用于对数据项集合进行搜索。数据项集合可接受就符合查询的特定数据项的搜索。

值得注意的是此生成步骤可包含对于要在查询中使用的数据项确定一个或多个历史描述符和/或特征描述符。因此,搜索步骤可包含利用至少一个历史描述符和/或特征描述符对数据项集合进行搜索。

附图说明

附图中示出当前的优选实施例,不过应该理解的是本发明并不严格限于示出的配置和工具。

图1A为一表格,列举了根据本发明用来描述数据集合中的数据项的描述符维数。

图1B为一表格,列举了根据本发明用来描述数据集合中的数据项的特征描述符。

图1C为一表格,列举了根据本发明用来描述数据集合中的数据项的历史描述符。

图1D为一表格,列举了根据本发明用来描述数据集合中的数据项的附加的历史描述符。

图2为示出根据本发明的联系数据项和描述符的方法的流程图。

图3为根据本发明的联系数据项和描述符的示例性图形用户界面。

图4为示出根据本发明的搜索数据集合的方法的流程图。

具体实施方式

此处公开的本发明可提供一种用来描述、搜索和管理数据集合中的数据项的解决方案。可使用几组描述符来描述数据项的潜在应用、数据项的特征和内容以及数据项的使用和运用历史。各种描述符组中的每一个都可以用来对数据项集合进行搜索和索引。历史描述符,可用来管理数据项。此处使用的术语“数据项”可包含硬件配置文件、数据条目、多媒体文件、文档、绘图、图表、电子表格、软件对象、记录、Web站点、Web网页,或任何其他电子文档、编程模型、数据模型、软件成分,或可以是可搜索集合的一部分的信息项。

可为集合中的数据项提供的一组描述符是具有维数值的维数,如图1A的表格100中所示。描述符维数和维数值可用来详细表示潜在的使用或使用数据项的条件。描述符维数表示两个不同主题、题目、使用和/或分类之间的标度。根据本发明的一实施例,标度的两端可互相相反。

例如,像宣传或预约材料这样的数据项的潜在的使用可规定为“全局对局部”。即数据项可指定为由局部客户和/或全局客户使用。可提供维数值120来定量描述数据项与描述符维数的主题的关系。特别是,维数值可定量描述标度中的位置,表示数据项与标度各端的关系的相对百分比或度量。就前一个例子来看,维数值可表示宣传材料是否更相关,或更可能,应用于全局语境、局部语境或可同等应用于全局和局部应用两者。

维数值可基于顺序数字系统、顺序字母系统或任何其他可描述各项顺序的符号系统。例如,如果对描述符维数使用从1到5的维数值,则任何对特定描述符维数具有维数值3的数据项都可同等应用于由描述符维数代表的每个主体或与其相关。维数值1或5可意味着数据项主要是应用于一个或另一个主题。例如,与描述符维数“全局对局部”相关联的维数值1可表示数据项在本质上完全是全局性的。应用于描述符维数“全局对局部”的维数值5可表示数据项在本质上完全是局部性的。通过比较,维数值2可表示数据项在本质上主要是全局性的。

应该理解,描述符维数可代表2个以上的主题。特别是,描述符维数可表示3个、4个或更多的不同主题。比如,与描述符维数相关联的值可指定为位置顺序编号的网格上的位置。描述符维数可视地表示为具有4个不同主题的正方形,其中每个主题由正方形的一个边表示。正方形的面积可分割为9个或更多的顺序编号的块,使单个值可表示指定的数据项与4个主题中的每个主题的关系。此外,本发明不限于以任何特定格式代表多维描述符。比如,与一多维描述符相关联的值可表示为矢量。

参考图1B的表格130,可提供特征描述符。此特征描述符可用来描述或表示数据项的内容。这样,特征描述符可提供对数据项的功能或数据项实际内容的描述。比如,特征描述符可描述作为内部使用而优选的数据项、作为数据库系统的对象的数据项、声频段数据项或具有任何其他可配置特征的数据项。就是说,一个系统管理员可确定数据项可与其相关联的给定域的一个或多个特征。

历史描述符可表示数据项的运行寿命周期和使用历史,如图1C的表格150所示。因此,可对一个数据项集合进行搜索以查找由历史描述符的具体子集所代表的选定的历史参数。比如,一个“共享”历史描述符可表示由不同应用共享的数据项。例如,一个如XML(扩展置标语言)文档的具体文档可由一个或多个应用,如数据库应用和/或浏览器,访问。这一信息可由“共享的”历史描述符予以标记。一“复制”历史描述符可表示一个数据项是否被复制,比如,由何人和何时复制。

使用历史描述符可描述数据项的历史使用情况。比如,可提供下载历史,其中包含具体数据项下载的频率、具体下载事例的日期和时间、用来检索实体的具体应用、访问此数据项的用户的标识以及与下载历史有关的其他信息。与此类似,借助使用描述符也可指定软件对象的观察次数、何时和由何人观察。

可提供修改历史描述符来描述数据项的历史变化。一个数据项可修改不止一次,单个修改历史描述符可表示数据项的完整的修改历史。另外一种方法是可以有多个修改历史描述符与一个数据项相关联,其中每个描述符代表一个修改事例。值得注意的是描述符可包含参考或指向数据项的先前版本,从而允许跟踪数据项的先前的版本。

下面参考图1D的表格180,另一种类型的历史描述符可包含所有权描述符190。所有权描述符可描述数据项的创建者、作者和/或所有者。比如,所有权描述符可将当前所有者与数据项相关联,即负责维护数据项的负责人员和/或组织。所有权描述符还可确定数据项的创建者和任何过去的所有者。所有权描述符还可确定具体数据项的所有权何时修改的日期。另外,此处公开的示例不应该解释为对本发明的限制。

在任何情况下,描述符维数和维数值、历史描述符和特征描述符可用来搜索和/或索引数据项集合。历史描述符可用来管理数据项集合。

图2为示出根据本发明的关联数据项和描述符的方法的流程图200。参考步骤210,数据项可输入到集合。例如,可创建一个软件对象并存储于库中,可将一个记录输入到数据表,可在现有的系统中增添一个硬件配置文件,和/或在网络上增添一个Web网页或Web站点。

参考步骤220,数据项可与多种描述符相关联。数据项与描述符的关联可由一个或多个管理人员手动完成或利用适当的工具以半自动方式完成。对数据项可赋予一个或多个可用的描述符维数和可用的维数值。特征描述符和历史描述符也可与数据项相关联。参考步骤230,与数据项相关联的描述符可按着需要更新或增添。比如,当数据项修改时,可创建或更新跟踪数据项改变的描述符以便记录数据项修改的日期、何人修必数据、对数据项做出的改变以及数据项原来的版本存储于何处。

图形用户界面(GUI)可用来关联一个集合的数据项与此处公开的各种描述符。例如,当一个数据项输入到一个集合时,可包含在数据描述符工具中作为其一部分的GUI 300可提供给管理员或用户。GUI 300可提供一个描述符的标准列表,用户可从其中进行选择将描述符与所选择的数据项相关联。GUI 300可结合数据项选择器字段310和“浏览”可激活图标320以便挑选描述符可与之相关联的数据项。为了挑选数据项,用户可将文件名或地址输入到选择器字段310或利用“浏览”图标320激活搜索树来浏览目录。可通过从链接到描述符列表或表格的下拉式菜单330中选择描述符而将该描述符与数据项相关联。

如果该描述符是维数类型,则描述符的维数部分可利用下拉式菜单330选择。可提供单选按钮340来便于用户选择要与维数相关联的维数值。虽然图3中示出的是1-5的标度,但应该理解此范围可大可小,可根据希望反映数据项与给定的描述符维数的各种对象之间的关系而定。在所选择的描述符不是维数类型时,单选按钮340可以隐藏或停用。诸如特征描述符和历史描述符这样的描述符也可与所选定的相关联。在任何情况下,每个类型的描述符的一个或多个描述符可与给定的数据项相关联。例如,在GUI 300中可提供一个可激活的图标供选择附加的描述符和将附加的描述符与所选定的数据项相关联。描述符数据,包含描述符维数和维数值(如可用),可存储到数据存储装置,如表格、文本文件和/或关系数据库。

在GUI 300中可提供一个“创建新描述符”的可激活的图标350供启动创建新的或常规的描述符。例如,当用户选择“创建新描述符”的可激活的图标350时,可提供一个新GUI供输入描述符信息。因此,如果用户感到常规的描述符将会更精确地描述一个具体的数据项,就可以创建一个这样的描述符。也可以向用户提供一种使其可以对其他数据项使用新创建的描述符的选择。例如,新创建的描述符可添加到默认描述符列表中。

还有,也可以使用多种其他的GUI格式和样式,这是本专业人士所公知的。所以,此处公开的各种GUI只是供示例之用而不应该理解为对本发明的限制。例如,GUI可用来更新描述符。根据本发明的一个实施例,可以向用户提供一种使其可以查看所有与具体数据项相关联的描述符并选择描述符进行更新和/或编辑的选择。要更新的描述符信息可以按如下方式提供,即使用户可以对所选择的信息进行编辑。当数据项的历史改变时,描述符也可以自动地更新,比如,当数据项由应用使用或共享、由用户访问和/或当数据项的内容改变时。

图4为示出根据本发明的从用户接收搜索参数以搜索数据集合的方法的流程图400。参考步骤410,可将用户信息输入到用户界面,可据之构造搜索查询。重要的是用户界面可向用户提供一系列的问题来识别可能的与描述符维数和维数值、特征和/或历史要求有关的搜索参数。比如,可以使用是/否问题和/或自然语言处理技术。

下面的是一个可以提供给用户的示例性问题:“您正在准备的演示真的是为CEO和处理大规模销售的诸多业务经理使用的吗?”。如用户对问题的回答为“是”,由问题生成的搜索标准可确定要定位的数据项是具有“商务对技术”和“大批用户对选择的用户”(具有的维数值为1)的数据项。还可以形成附加的问题来引出用户的响应指明其他的描述符维数、维数值、特征和历史描述符,以及任何其他类型的与可搜索集合的实体相关联的描述符。例如,问题可以组织成为层次排序的决策树,其中用户对前一个的问题的响应确定下一个提出哪一个问题。一旦用户遍历决策树,就可根据用户的回答形成查询。

还有,本专业人士会认识到此处参考图4公开的方法可应用于自动向数据集合的数据项赋予描述符的目的。例如,上述的问题可提供给用户。如用户回答“是”,则可将正在开发的演示与“商务对技术”和“大批用户对选择的用户”的描述符维数相关联。维数值1可与每个描述符维数相关联。另外,还可以向用户提出附加的问题来确定演示在多大程度上适合描述符维数的每一个主题。例如,问题可请求用户指定演示与描述符维数的给定主题的关系,或是演示将会向一个或多个观众显示多少次。在查询中指定的不同类型的观众可间接地代表给定的描述符维数的主题。由用户的响应,可确定单一的维数值。

在另一配置中,可向用户提供带有供选择相关描述符的复选框的列表。另外,可以提供可调节的滑动标度用来选择维数值。在又一种配置中,可执行文本采掘来从用户的并非仅仅为是/否的回答中选择关键词语。然而,存在有多种方式可向用户提出问题和接受用户的输入。因此,本发明不限于此处公开的各种技术。

用户对问题的响应可用来表述查询内规定的搜索标准,如步骤420所示。特别是,根据用户对问题的响应可生成规定多个描述符维数和相应的维数值的查询。如前所述,规定特征和历史描述符的其他查询参数可由用户响应生成。参考步骤430,搜索引擎可搜索数据集合来查找具有符合查询的描述符的数据项。在步骤440中,可返回符合查询的数据项的列表。如前所述,本专业人士会认识到,可采用与图4的方法类似的过程来将描述符赋予数据集合的数据项。

本发明可通过硬件、软件或硬件和软件的组合实现。本发明在一个计算机系统中可以以集中方式实现,而在不同的要件分布在数个互连的计算机系统中的场合以分布方式实现。任何一种计算机系统或采用的用来执行此处所描述的方法其他装置都是适合的。一种典型的硬件和软件的组合可以是这样一种通用计算机系统,该计算机系统具有的计算机程序在装入并执行时可控制计算机系统使其执行此处所描述的方法。

本发明也可嵌入到计算机程序产品中,该计算机程序产品包括所有可使此处所描述的方法的实现成为可能的特点,并且该计算机程序产品在装入到计算机系统中时可以执行这些方法。在此上下文中的计算机程序指的是企图使具有信息处理功能的系统直接或在经过下面之一或两者之后,即a)变换为另一语言、代码或记法;b)以不同的材料形式再现,执行一个具体功能一组指令的以任何语言、代码或记法的任何表达。

本发明可在不脱离其精神或基本属性的条件下以其他形式具体实现。因此,表示本发明范围时应该参考下面的权利要求而不是上面的说明书。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号