首页> 中国专利> 用于扩展搜索结果超出初始查询定义的界限之外的系统、方法、界面和软件

用于扩展搜索结果超出初始查询定义的界限之外的系统、方法、界面和软件

摘要

为了便于法律研究,诸如Thomson West的公司提供了基于订阅的在线信息检索系统。为了寻求提高这些以及相关的IR系统,本发明人意识到研究者常常忽略可能对他们有用的一些文档类型,诸如法律百科全书和论文。因此,本发明人设计了自动搜索不被用户查询特别当作目标的其它类型的文档的系统、方法和软件。一个示范系统自动地递交对于法律意见的用户查询给第一和第二数据库,第一数据库存储法律意见,并且第二数据库存储非意见文档,诸如来自West Key Number系统的批注、来自美国法律报告的文章、和/或来自美国法学的文章。

著录项

  • 公开/公告号CN101107602A

    专利类型发明专利

  • 公开/公告日2008-01-16

    原文格式PDF

  • 申请/专利权人 汤姆森环球资源公司;

    申请/专利号CN200580005139.4

  • 申请日2005-01-03

  • 分类号G06F17/30(20060101);

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人程天正;王勇

  • 地址 瑞士祖格

  • 入库时间 2023-12-17 19:41:21

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-13

    未缴年费专利权终止 IPC(主分类):G06F17/30 专利号:ZL2005800051394 申请日:20050103 授权公告日:20120118

    专利权的终止

  • 2020-05-01

    专利权的转移 IPC(主分类):G06F17/30 登记生效日:20200414 变更前: 变更后: 申请日:20050103

    专利申请权、专利权的转移

  • 2018-07-20

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20050103

    专利权人的姓名或者名称、地址的变更

  • 2016-10-12

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20050103

    专利权人的姓名或者名称、地址的变更

  • 2012-01-18

    授权

    授权

  • 2008-03-05

    实质审查的生效

    实质审查的生效

  • 2008-01-16

    公开

    公开

查看全部

说明书

版权公告和许可

本专利文档的一部分包含受版权保护的材料。版权所有者对于任何人复制专利文档或者专利公开内容没有异议,因为它出现在专利和商标局专利文件或记录中,但是无论怎样,在其它方面保留所有的版权。下面的公告适用于本文档:版权2003,Thomson Global Resources AG。

相关申请的交叉引用

本申请要求在2003年12月31日提交的美国临时申请60/533,819的优先权。该临时申请在此引入作为参考。

技术领域

本发明的各种实施例涉及信息检索系统,诸如提供法律文档或其它相关内容的那些。

背景

美国法律体系以及世界各地的一些其它法律体系很大程度上依赖于书面司法意见、书面法官宣判,以便明白地表达或解释支配(govern)争议解决的法律。每个司法意见不仅对解决特殊的法律争议重要,而且对在将来解决类似的争议或者案件重要。因为这点,我们的法律体系内的法官和律师不断地对日益膨胀的大量的过去意见、或者案例法进行研究,找出与新争议的解决最相关的那些。

为了便于这些搜索,St.Paul的West Publishing公司,Minnesota(进行如Thomson West那样的商业活动)从跨美国的各个法院收集司法意见,并且使得它们可以通过它的WestlawTM信息检索系统以电子方式得到。(Westlaw是Thomson West的商标。)这些意见中的很多是带有对其它意见的文献目录引用或超链接来发表的,该其它意见是依赖于这些意见中的各种法律点或者是对这些意见中的各种法律点进行评判。引用和超链接使研究者能找到包含相关意见或者通过计算机网络容易地以电子方式访问的相关意见的印刷册。Westlaw系统使得用户能够搜索1亿多文档。

本发明人所意识到的、对于该有效且非常成功的系统的至少一个问题是:除了意见以外,还存在很多其它类型的文档,它们可能对法律研究者有用,但是常常被忽略。例如,一些用户没有充分利用West KeyNumberTM系统,该系统提供了在司法意见中做出的法律点的分类概要(West Key Number是Thomson West的商标)。称为批注(headnote)的概要被分类到90,000个以上不同的法律种类,并且可被用于各种目的,诸如评价法律意见与特定法律问题的相关度。其它的则忽略了次级资源,诸如美国法律报告(American Law Reports,ALR),其包括大约4,000篇深入的学术文章,每篇都教授了关于一个独立的法律问题。

因此,本发明人已经认识到对用于法律文档的信息检索系统的改进的需要。

概述

为了解决这个和/或其它需要,本发明人设计了响应于对法律意见的查询而便于相关非意见法律文档的检索的系统、方法和软件。一个示范系统自动将对于法律意见的用户查询递交给第一和第二数据库,第一数据库存储法律意见并且第二数据库存储非意见文档,诸如来自West KeyNumber系统的批注、来自美国法律报告的文章和/或来自美国法学(American Jurisprudence)的文章。系统中的第一搜索引擎基于该查询而在第一数据库中搜索相关的法律意见。第二搜索引擎搜索第二数据库两次:第一次基于用户查询以及第二次基于来自第一搜索引擎的结果。在一些实施例中,第一搜索引擎是常规的tf-idf(单文本词汇频率-逆文本频率)搜索引擎,以及第二搜索引擎是基于合成矢量的分类器。来自第一和第二数据库的结果都经由图形用户界面呈现给用户,该图形用户界面在分开的区域、窗格或窗口中显示结果。

在其它实施例中,第二数据库提供了专题讨论文、州实践指南(statepractice guides)、法令和/或法律评论文章以扩充案例法数据库的搜索。而且,其它实施例增加了法令搜索、规章搜索、次级(secondary)材料搜索以及新闻搜索。一些实施例为访问第二数据库的文档收取独立的或者附加的费用。

附图简述

图1是相应于本发明的一个或多个实施例的示范信息检索系统100的图;

图2是相应于操作系统100以及本发明的一个或多个实施例的一种或多种示范方法的流程图;以及

图3是相应于本发明的一个或多个实施例的示范查询窗口300的复制;

图4是相应于本发明的一个或多个实施例的示范用户界面400的复制。

图5是相应于本发明的一个或多个实施例的示范用户界面500的复制。

图6是相应于本发明的一个或多个实施例的示范用户界面600的复制。

图7是用于相应于本发明的一个或多个实施例的次级搜索模块的示范结构和工作流程图。

图8是用于相应于本发明的一个或多个实施例的文本分类器的示范结构或工作流程图。

示范实施例详述

参考并结合上述图的本说明描述了发明的一个或多个具体实施例。这些被提供来不是限制而是仅仅例证和教授本发明的实施例足够详细地被示出和描述以使本领域的技术人员能实现或实践本发明。因此,在适当之处为避免混淆本发明,本说明将忽略本领域技术人员已知的一些信息。

另外,本文档引入以下项作为参考:2002年12月23日提交的美国临时专利申请60/436,191(律师案号962.021PRV);2001年12月21日提交的美国专利申请10/027,914(律师案号962.015US1);2002年12月30日提交的美国临时专利申请60/437,169(律师案号962.016PRV)以及2003年6月19日提交的美国临时专利申请60/480,476(律师案号962.016PR0)。本申请的一个或多个实施例可以组合或者另外通过参考申请中的教义来扩充而产生其它实施例。

示范信息检索系统

图1示出了示范在线信息检索系统100。系统100包括一个或多个数据库110、一个或多个服务器120以及一个或多个访问设备130。

数据库110包括一组主数据库112和一组第二数据库114。在示范实施例中,主数据库112包括案例法数据库1121和法令数据库1122,其分别包括来自一个或多个地方、州、联邦和/或国际管辖区域的司法意见和法令。次级数据库114,包含次级法律机关的法律文档或更普遍地从属于主数据库中司法或立法机关提供的那些的法律文档,该次级数据库包括ALR(美国法律报告)数据库1141、AMJUR数据库1142、West KeyNumber(KNUM)分类数据库1143、以及法律评论(LREV)数据库1144。其它实施例可能包括非法律数据库,其包括财政、科学或保健信息。此外,在一些实施例中,主和次级意味着搜索结果的呈现次序,而不是必定意味着搜索结果的权威性或可信性。

表现为一个或多个电子、磁或光数据存储设备的示范形式的数据库110包括或者另外与各自的索引(未示出)相关联。每个索引包括与相应的文档地址相关联的术语和短语、标识符和其它常规信息。数据库110经由诸如局域网、广域网、专用网或者虚拟专用网的无线或有线通信网络被耦合到或者能够被耦合到服务器120。

服务器120通常代表用来服务于带有关联小应用程序、ActiveX控制、远程调用对象或者其它相关软件和数据结构的网页形式或者其它标记语言形式的数据的一个或多个服务器,以服务于不同“厚度(thickness)”的客户。更具体地,服务器120包括处理器模块121、存储器模块122、订户数据库123、主搜索模块124、次级搜索模块125以及用户界面模块126。

处理器模块121包括一个或多个本地或分布式处理器、控制器或虚拟机。在示范实施例中,处理器模块121采取任何便利的或者期望的形式。

表现为一个或多个电子、磁或光数据存储设备的示范形式的存储器模块122存储订户数据库123、主搜索模块124、次级搜索模块125以及用户界面模块126。

订户数据库123包括订户相关的数据,用于控制、掌管并管理数据库110的帐单到期即付(pay-as-you-go)或者基于订阅的访问。在示范实施例中,订户数据库123包括一个或多个偏好数据结构,数据结构1231是其代表。数据结构1231包括顾客或者用户标识符部分1231A,其逻辑上与一个或多个次级搜索偏好相关联,诸如偏好1231B、1231C以及1231D。偏好1231B包括一个缺省值,其支配着当搜索选择的数据库,诸如案例法数据库时,使能还是禁止补充搜索。偏好1231C包括一个缺省值,其支配着次级搜索结果的补充的呈现,例如,各种内容类型的列出优先权或者这样的结果的最大显示数。偏好1231D包括一个缺省值,其支配着在次级搜索期间使用两个或多个次级搜索算法或接受准则中的哪个(没有临时的用户超控(override),例如在特定的查询或者会话期间的超控,则补充搜索偏好的缺省值来支配)。

主搜索模块124包括一个或多个搜索引擎以及相关的用户界面组件,用于接收并处理对于一个或多个数据库110的用户查询。在示范实施例中,与搜索模块124相关联的一个或多个搜索引擎提供布尔、tf-idf、自然语言搜索能力。

次级搜索模块125包括一个或多个搜索引擎,用于接收并处理对于一个或多个数据库110的查询。在示范实施例中,次级搜索模块125通过使用用户查询和/或来自主搜索模块124的结果,提供基于合成矢量的分类搜索。在其它实施例中,第二数据库提供专题讨论文、州实践指南、法令和/或法律评论文章以扩充案例法数据库的搜索。而且,其它实施例增加了法令搜索、规章搜索、次级材料搜索以及新闻搜索。一些实施例为访问第二数据库的文档收取独立的或者附加的费用。

用户界面模块126包括机器可读和/或可执行指令组,用于在诸如访问设备130的一个或多个访问设备上,通过无线或有线通信网络完全或部分地定义基于web的用户界面,诸如搜索界面1261和结果界面1262。

访问设备130通常代表一个或多个访问设备。在示范实施例中,访问设备130表现为个人计算机、工作站、个人数字助理、移动电话、或者能够给有效的用户界面提供服务器或者数据库的任何其它设备的形式。具体地,访问设备130包括处理器模块131一个或多个处理器(或处理电路)131、存储器132、显示器133、键盘134以及图形指示器或者选择器135。

处理器模块131包括一个或多个处理器、处理电路、或者控制器。在示范实施例中,处理器模块131采取任何便利的或者期望的形式。存储器132被耦合到处理器模块131。

存储器132为操作系统136、浏览器137以及图形用户界面(GUI)138存储代码(机器可读的或者可执行的指令)。在示范实施例中,操作系统136采取微软Windows操作系统的版本形式,并且浏览器137采取微软Internet Explorer版本的形式。操作系统136和浏览器137不仅接收来自键盘134和选择器135的输入,还支持在显示器133上再现GUI138。刚一再现,GUI 138就提供与一个或多个交互控制特征(或用户界面元素)相关联的数据。(示范实施例通过使用来自服务器120的小应用程序或者其它与程序有关的对象或结构,定义了界面138的一个或多个部分。)

更具体地,图形用户界面138定义或提供一个或多个显示区域,诸如查询或搜索区域1381以及搜索结果区域1382。查询区域1381被定义在存储器中并且刚一再现就包括一个或多个交互控制特征(元件或窗口小部件),诸如查询输入区域1381A、查询递交按钮1381B以及次级搜索选择1381C。搜索结果区域1382也被定义在存储器中,并且刚一再现就包括主结果区域1382A和次级结果区域1382B。区域1382A包括一个或多个交互控制特征,诸如用于经由服务器120从一个或多个数据库110访问或检索一个或多个相应的主搜索结果文档的特征A1、A2、A3。每个控制特征包括各自的文档标识符或者标签,诸如DOC X、DOC Y、DOC Z,以为相应的文档识别各自的题目和/或引用。区域1382B包括一个或多个交互控制特征,诸如用于经由服务器120从一个或多个数据库110访问或者检索一个或多个相应的次搜索结果文档的特征B1、B2、B3。每个控制特征包括各自的文档标识符或者标签,诸如DOC1、DOC2、DOC3,以为相应的文档识别各自的题目和/或引用。

在示范实施例中,这些控制特征的每一个采取超链接或者其它浏览器可兼容的命令输入的形式,并且提供对查询区域1381和搜索结果区域1382的访问以及控制。区域1382中控制特征的用户选择导致界面138区域内的相应文档的至少一部分的检索和显示(在本图中没有示出)。尽管图1将查询区域1381和结果区域1382显示为同时显示的,但是一些实施例在分开的时刻呈现它们。此外或者替代地,一些实施例在区域1382内混合主和次结果。这些实施例的一些变化以将次级结果与主结果明显区分开来的字体呈现该次级结果,和/或组合指示它们为次级或补充的图标来呈现该次级结果。

示范操作

图2示出了操作诸如系统100的系统的一种或多种示范方法的流程图200。流程图200包括块210-270,这些块和本描述中的其它块一样在示范实施例中以连续顺序被安排并且被描述。然而,通过使用多个处理器或者类似处理器的设备或者组织为两个或多个虚拟机或子处理器的单个处理器,一些实施例并行执行两个或多个块。一些实施例还改变处理顺序或者提供不同的功能分割以实现类似的结果。例如,一些实施例可以改变客户-服务器的功能分配,以便于在服务器端示出和描述的功能在客户端全部或部分地实现,并且反之亦然。而且,还有其它实施例将所述块实现为两个或多个互连的硬件模块,相关的控制和数据信号在模块之间以及通过模块来通信。因此,示范处理流程(图2中以及在本描述的其它地方)应用到软件、硬件以及固件实现。

块210需要呈现搜索界面给用户。在示范实施例中,这需要用户将客户访问设备中的浏览器指向诸如Westlaw系统的在线信息检索系统的互联网-协议(IP)地址,  然后登录到该系统。成功的登录导致诸如图1中的界面138或图3中的界面300(或其一个或多个部分)的基于web的搜索界面从服务器120输出、存储在存储器132中并且通过客户访问设备130来显示。

如图3中所示,界面300包括多个交互控制特征,包括查询输入区域310、查询递交命令320以及次级指示区域330。查询输入区域310接收定义查询的文本输入。次级指示区域320允许用户明确地使能或禁止次级数据库或资源的搜索。该指示区域的初始状态由存储在诸如数据库124的订户数据库中的缺省用户偏好值来确定。在示范实施例中,改变指示区域的状态是为当前的查询改变了指示;缺省偏好值不受影响,除非是在较高的控制级别、诸如经由偏好控制区域被改变。一些实施例还包括交互控制特征,诸如复选框或菜单组,其允许用户定义与次级结果的显示相关的偏好。例如,一个实施例允许用户通过内容类型来为次级结果的显示次序区分优先次序,具体而言是哪种内容类型应当被首先列出。查询递交命令320允许用户使得访问设备130将在输入区域310中定义的查询以及次级指示区域320中的设置递交给服务器,诸如服务器120。

通过使用界面138或300,用户可以定义或递交查询并使得它输出给服务器,诸如服务器120。在其它实施例中,查询可能已经被用户定义或选择以自动地基于进度表或者事件驱动来执行。在这些情况下,查询可能已经驻留在信息检索系统的服务器的存储器中,并且因此不需要重复地传给服务器。然后执行前进到块220。

块220需要接收查询。在示范实施例中,查询包括查询串和/或包括一个或多个选择数据库的一组目标数据库。在一些实施例中,查询串包括一组术语和/或连接符,并且在其它实施例中包括自然语言串。而且,在一些实施例中,目标数据库组是基于系统或搜索界面的形式而被自动定义或者缺省地定义的。而且在一些实施例中,接收到的查询可能伴随有其它信息,诸如定义是否搜索次级资源的信息。在任何情况下,执行在块230处继续。

块230需要基于或者响应于接收到的查询来识别一组文档或搜索结果。在示范实施例中,这需要服务器或组件受服务器控制或命令,以执行对于目标数据库组的查询并且识别满足查询准则的文档。执行前进到块240。

块240需要基于查询而识别一组一个或多个次级文档。(在一些实施例中,双重识别块的执行要视一个规定是否识别重复文档的缺省或者选择的用户选项而定。)在示范实施例中,次级识别通常需要使用第二搜索引擎或者更准确地说多分类器文本分类引擎以搜索第二数据库。

更具体地,示范实施例遵循流程图240中示出的方法,其包括处理块241-244。块241需要基于用户查询来搜索次级数据库。在示范实施例中,该搜索需要使用次级搜索模块,其包括基于合成矢量的分类器。更具体地,一些示范系统通过确定一组合成得分来分类或者帮助人工分类一个输入文本,每个合成得分对应于被认为用于包含作为次级搜索结果的各个文档并且基于“一个或多个,优选地两个或多个分类器的相似度或者相关度得分”。确定每个得分需要计算并应用类别特定的权重到下列得分类型的一个或多个:

●第一类型,基于查询文本(或主结果文档)和与次级数据库(可能的次级文档)中一个相应文档相关联的文本的相似度;

●第二类型,基于一组与查询文本相关联的Key Number类和一组与可能的次级文档中一个相应文档相关联的Key Number类的相似度;

●第三类型,基于给定一组一个或多个Key Number类时、可能的次级文档中的一个文档与查询文本相关联的可能性;以及

●第四类型,基于给定本文(例如,批注)时、查询文本与可能次级文档中的一个相应文档相关联的可能性。

决定是否将特定的文档包括在次级搜索结果中或者从其中排除需要对照决策准则来评估每个得分,诸如文档特定的阈值。

块242需要基于来自块230处的第一搜索引擎的结果而搜索次级数据库。在示范实施例中,该搜索需要从主搜索结果的文档子集中提取文本,诸如名词对,以定义特征池或集合。提取的文本然后被输入到文本分类器中,诸如上面指出的多分类器引擎,并且与可能相关的文章或者更普遍地次级数据库中的文档相比较。在文本分类器的上下文中,诸如ALR、AmJur或Key Number的数据库中的可能的文档,批注聚集(headnoteconglomeration)被视为分类。然后那些由多分类器引擎依靠满足相似度阈值而判断为充分相似于其它搜索结果的文档被包括在次级搜索结果中。在一些实施例中,来自主搜索结果的预置个数的最相关文档-例如,前5个文档或者文档的前5%-被用作基础。而且,一些实施例可能将主搜索结果的子集用作“更类似于其”类型的次级数据库的搜索的基础。执行在块243处继续。

块243需要将来自次级数据库的搜索结果组合到次级结果集合中。在示范实施例中,扩展的或者次级搜索结果包括被确定为与查询相关的ALR、AmJur部分以及West Key Number系统分类代码(和/或相关联的批注)。

在示范实施例中,次级数据库的主题范围集中在法律材料。然而,在一些实施例中,任何相关的信息域可以被搜索,包括例如新闻和财政数据库、专业目录等等。在确定次级数据库文档的相关度中,一些实施例依赖次级搜索引擎之外的顾客跟踪或者使用信息。该信息确保在相似的搜索之后,频繁被使用(也就是“点击”)、打印和/或关键词引用的文档更可能被包括在次级结果中。此外,一些实施例将文档中的术语位置用作在确定候选次级结果的相关得分或排序中的因素。执行在块250处继续。

块250需要将来自主和次级数据库的结果经由图形用户界面呈现给用户。在示范实施例中,这需要在一个或多个分开的区域、窗格或窗口中、临近主结果的列表显示次级结果的列表,每个列出的文档或者更一般地是每个项,与诸如超链接的相应交互控制特征相关联,其可由用户选择以在相同或分开的窗口中调用关联文档(或其一部分)的检索和/或显示。例如,参见图1中的区域1381和1382或者图3中的区域310和320。

一些实施例自动地将在分开的窗格中示出的次级项数限制到预定的项数,诸如10。示范结果包括到来自美国法律报告(ALR)和美国法学2d(AMJUR)数据库的文档的链接,以及到West主题和检索号参考的链接。(一些实施例还排除诸如ALR或AmJur文档的次级结果文档,其具有红色KeyCite(关键词引用)状态标志(指示文档已被淘汰))。此外,包括案例法和法令的主结果可能包括到论文和法律评论的链接。一些实施例包括“扩展”控制特征,其允许用户选择性地扩展显示的次级结果列表的数量和/或大小,并且因此获得对次级结果的更加扩展的列表的访问。

块260需要呈现次级搜索结果中的一个或多个。在示范实施例中,这需要用户点击列出的次级搜索结果中的一个或多个并且由此导致访问设备130发起或递交对这一个或多个项的请求。依赖于通常由订阅参数确定的用户的访问权,用户帐户被收取访问次级搜索结果的费用。一些实施例呈现关于任何费用评估的咨询消息给用户,以给用户提供一个选项来取消访问。

例如,点击列出的项322(图3中)导致在诸如图4中的界面400的界面内呈现相应的ALR文章。界面400包括示出至少一部分相应的ALR文章的文档显示区域410、重新列出ALR文章的识别信息的文档列表420、以及可选择来导致为用户进行文章打印、电子邮寄或其它输出的打印命令输入430。

类似地,选择或点击图3中列出的项324导致在诸如图5中的界面500的界面内呈现相应的AMJUR文章。界面500包括示出至少一部分相应的AMJUR文章的文档显示区域510、重新列出AMJUR文章的识别信息的文档列表520、以及可选择来导致为用户进行文章打印、电子邮寄或其它输出的打印命令输入530。

选择在图3中列出的项326导致在诸如图6中的界面600的界面的呈现,其显示示出与列出的项326的West Key Number分类有关的批注的定制摘要页。界面600包括示出至少一部分相应的定制摘要页的文档显示区域610、重新列出West Key Number分类的识别信息的文档列表620、以及可选择来打印、电子邮寄或另外输出文章的打印命令输入630。

在察看了次级搜索结果之后,用户可以重新显示主搜索结果(以及次级搜索结果)。例如,用户可以使用在她的浏览器上的“后退”按钮或者激活界面400、500或600之一上的返回或“后退”链接。

用于补充搜索功能的示范结构

图7示出了用于实现服务器120的补充搜索功能的示范结构700。示范结构包括负载平衡路由器710、命令和控制(CnC)服务720以及后端搜索(或分类)服务装置730。

具体地,负载平衡路由器710从诸如客户702、704和706的一个或多个客户接收主和次级搜索请求。路由器710以循环或其它方式发送查询到CnC服务,以确保同一请求的两个阶段(即,主和次级请求)都被发送给相同的后端服务装置(或机器)并且从它的服务池中添加和减去机器以反映当前的可用性。在被转发到一个CnC服务720之前,所有请求/响应被以XML编码。

CnC服务720包括一个或多个独立的CnC服务,诸如CnC服务722、724和726。通常代表每个CnC应用服务的CnC服务724包括消息处理机724A、AMJUR事件处理机724B、Key Number(KN)事件处理机724C、以及ALR事件处理机724D。每个CnC服务将客户消息传递给后端服务,组合来自后端服务730的响应以产生建议(或搜索结果),并且通过路由器710将它们发送回客户。

后端搜索服务装置730包括分类器服务装置732、734和736。在本示范实施例中通常代表每个分类器服务装置的服务装置734包括AMJUR分类器(或搜索)服务744A、KNA分类器服务744B、KN查找服务744C、ALR-CC服务744D、ALR-HN服务744E、ALR-SEC服务744F。每个服务的名称反映了相关的查询区域。例如,ALR-HN处理单词对分类器或者从ALR中引用的所有批注(HN)中提取的特征集合。这些后端服务在两个处理阶段内“建议”多个信息类别(例如,ALR注解)。第一阶段是直接基于用户查询,而第二阶段是基于主搜索引擎响应于用户查询的、检索到的案例。所述服务和CnC可作为web服务而得到并且使用XML-RPC(远程进程调用)来彼此通信。

在示范实施例中,搜索查询被发送到次级搜索模块(阶段1),并行地或者同时它被发送给主搜索模块。在第二阶段,检索的案例(或其它文档)一旦变得可用就由客户将它们转发到适当的CnC服务。如果主搜索不检索任何案例,则客户发送空阶段2请求,因为路由器和CnC服务正预期一个阶段2请求。本图中的上面一行代表Westlaw客户,每个客户发送它的阶段1(即,查询文本)以及阶段2(即,结果案例)请求给路由器/负载平衡器。

用于分类器服务的示范结构

图8示出了用于实现示范系统100和示范结构700中使用的多分类器的示范结构800。结构800包括特征池810、类别池820、分类器池830、元分类器池(meta-classifier pool)840以及决策者池850。

结论

促进本领域技术的发展中,发明人提出了多种示范系统、方法和软件,它们尤其有利于利用附加信息来补充搜索结果。一个示范系统自动地将对于法律意见的用户查询递交给第一和第二数据库,第一数据库存储法律意见并且第二数据库存储非意见文档,诸如来自West Key Number系统的批注、来自美国法律报告的文章、和/或来自美国法学的文章。

以上描述的实施例仅仅旨在图示并教导实践或者实现本发明的一种或多种方式,而并不限制它的宽度或范围。包含实践或实现本发明的教义的所有方式的本发明实际范围只由以下权利要求和它们的等价物定义。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号