首页> 中国专利> 与基于文档类型的文档处理相关的方法及设备

与基于文档类型的文档处理相关的方法及设备

摘要

在一个实施例中,一种方法包含接收来自文档的文本的一部分。基于文本的所述部分或与所述文档相关联的识别符中的至少一者而使文档类型与所述文档相关联。所述方法还包含基于所述文档类型而选择具有多个章节的文档模板。来自所述多个章节的每一章节与一文档类别相关联。来自所述多个章节的至少一个章节包含至少一个策略偏好。

著录项

  • 公开/公告号CN102144227A

    专利类型发明专利

  • 公开/公告日2011-08-03

    原文格式PDF

  • 申请/专利权人 杰夫·施托尔曼;

    申请/专利号CN200980134231.9

  • 发明设计人 杰夫·施托尔曼;

    申请日2009-09-23

  • 分类号G06F17/27;G06F17/30;

  • 代理机构北京律盟知识产权代理有限责任公司;

  • 代理人章蕾

  • 地址 美国宾夕法尼亚州

  • 入库时间 2023-12-18 02:51:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-31

    授权

    授权

  • 2011-10-19

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20090923

    实质审查的生效

  • 2011-08-03

    公开

    公开

说明书

相关申请案交叉参考

本申请案主张在2008年9月23日提出申请的标题为“与基于文档类型的文档处理相关的方法及设备(Methods and Apparatus Related to Document Processing Based on aDocument Type)”的第12/236,257号美国专利申请案的优先权及权益,所述专利申请案以全文引用的方式并入本文中。

技术领域

实施例大体来说涉及文档处理,且特定来说涉及与基于文档模板处理文档的至少一部分相关的方法及设备。

背景技术

随着社会通过例如万维网的广域媒体而变得更非个人的,已变得需要提供/使用彼此的服务的各方之间的正式约定文档规则。此已导致各方为利用此类合同所涵盖的产品及/或服务而必须正式地或隐含地同意的合同文档编制(通常由服务提供者制定)的爆发。批准并再确认冗长且频繁改变的文档(包含最终用户许可证协议(EULA)、条款和条件及隐私政策)的需要通常对生产率造成了以下的此负担:许多用户不花费时间来阅读此类合同的条款及理解其所强加的义务及限制便同意所述条款。通常,用户对此暴露感到不安,但由于必须阅读并理解这些合同的负担而冒这样的风险,这些合同可为冗长的且充满典型用户可能不理解的法律术语-即使其花费时间来阅读文档全篇。

因此,存在对用于基于文档模板处理文档的至少一部分的方法及设备的需要。

发明内容

在一个实施例中,一种方法包含接收来自文档的文本的一部分。基于文本的所述部分或与所述文档相关联的识别符中的至少一者而使文档类型与所述文档相关联。所述方法还包含基于所述文档类型而选择具有多个章节的文档模板。来自所述多个章节的每一章节与一文档类别相关联。来自所述多个章节的至少一个章节包含至少一个策略偏好。

附图说明

图1是图解说明根据实施例经配置以处理文档的文档分析引擎的示意性框图。

图2是图解说明根据实施例由用户使用模板定义模块定义的模板的示意性框图。

图3是图解说明根据实施例基于主合同模板定义的用户特定合同模板的示意性框图。

图4是图解说明根据实施例与主模板集合相关联且与定制模板集合相关联的文档剖析功能件集合的示意性框图。

图5是图解说明根据实施例用于基于合同模板来分析合同的一部分的方法的流程图。

图6是图解说明根据实施例经配置以分析合同的若干部分的文档分析引擎的示意性框图。

图7是图解说明根据实施例经配置以响应于由第二实体请求的对文档的分析而与第一实体通信的文档分析引擎的示意性框图。

图8是图解说明根据实施例用于响应于更新请求而分析合同的一部分的方法的流程图。

图9是图解说明根据实施例两个策略度量对时间的趋势的示意性曲线图。

具体实施方式

文档分析引擎可经配置以响应于来自用户的请求而基于文档模板处理文档的一部分。具体来说,所述文档分析引擎可经配置以使用剖析功能件基于对所述文档的所述部分的解释将所述文档模板的章节与所述文档的所述部分进行比较。所述剖析功能件可经配置以基于本体及/或语义规则来解释所述文档的所述部分。在一些实施例中,可基于所述比较是否满足阈值条件而执行及/或触发一动作。此外,所述文档分析引擎可通过应用在所述文档模板内定义的策略而用作代表用户的策略筛选程序。在一些实施例中,条件/动作组合可称为策略偏好。

在一些实施例中,可由用户定制及/或可基于主模板来定义所述文档模板。在一些实施例中,可基于与所述文档模板相关联的识别符及/或条款来选择所述文档模板及/或所述剖析功能件。在一些实施例中,所述文档可与被请求用于(例如)由用户检视的目标内容相关联。

在一些实施例中,所执行及/或所触发的动作可基于对文档模板与和目标内容相关联的文档的比较。举例来说,如果所述文档是与由用户请求的目标内容相关联的合同文档(例如,最终用户许可证协议(EULA)或与网页相关联的隐私策略),那么所述文档分析引擎可经配置以基于剖析模块及用户定义的模板来确定所述文档的指定部分对于用户来说是否将为可接受的。在一些实施例中,所述文档分析引擎可经配置以识别所述文档的应由用户审查的部分。在一些实施例中,所述文档分析引擎可经配置以基于对所述文档的分析来限制或允许对所述目标内容的存取。

注意,除非上下文另外清晰指示,否则此所写说明书及所附权利要求书中所用的单数形式“一(a)”、“一(an)”及“所述(the)”包含复数的指称对象。因此,举例来说,术语“模板”打算意指单个模板或模板的组合/集合。此外,仅以实例方式结合合同处理来描述所述实施例中的许多实施例。本文中所描述的实施例中的任一者可广泛应用于对任一类型文档的处理(例如,分析)。

图1是图解说明根据实施例经配置以处理(例如,分析)文档164的文档分析引擎110的示意性框图。可响应于来自请求实体140(例如,计算实体,例如移动装置、个人计算机或可由(人类)用户控制的服务器)的请求而经由网络170将文档164(或文档的部分)从文档提供者180递送到文档分析引擎110。具体来说,文档分析引擎110可经配置以使用剖析模块150解释文档164的至少一部分(并使解释与其相关联)。文档分析引擎110还可经配置以使用模板模块160基于对文档164的所述部分的解释(例如,含义)与模板162中所包含的一个或一个以上章节的比较而执行(及/或触发)与文档164相关联的动作。在一些实施例中,还可将所述解释称为含义。

在一些实施例中,可基于例如合同(例如,租赁合同、EULA、条款和条件合同、不动产合同等)、书(例如,编译)、文章(例如,出版物、期刊文章、报纸文章)、用户手册、技术参考文档、合规报告等一个或一个以上文档类型来定义文档164。在一些实施例中,文档164可包含文本(例如,数字化文本、从网页获取的数字化文本)及/或媒体(例如,图像(地图、照片、技术图纸、流程图等)、视频、音频)。在一些实施例中,可(例如)通过文档分析引擎110来处理文档164,使得文档164可由文档分析引擎110以电子方式进行处理。在一些实施例中,文档164可为一整个文档(或多个文档)或一文档的一部分(或多个文档的一部分)。

在文档164的分析期间使用的模板162内的一个或一个以上章节可包含文本(例如,数字化文本)及/或媒体(例如,图像、视频、音频)。在一些实施例中,模板内的章节可经定义使得其与和文档164相关联的一个或一个以上章节对应。在一些实施例中,模板162可包含通常出现于经识别以供使用文档分析引擎110进行分析的特定类型文档中的章节。

在一些实施例中,模板162内的章节可包含可由模板模块160在模板162的所述章节与文档164的比较期间使用的关键字。在一些实施例中,所述关键字可呈特定次序及/或可根据指定的语义规则相关。

在一些实施例中,模板162可包含标准化章节及/或由(例如)用户(例如,请求实体140)定义的定制章节。换句话说,模板162的一个或一个以上章节可包含(例如)管理团体或组织所采用的标准化语言。因此,可将文档164与模板162中所包含的标准化语言进行比较。

剖析模块150可经配置以基于例如图1中所展示的文档剖析功能件152的一个或一个以上文档剖析功能件来解释文档164(例如,确定其含义、从其提取含义)。具体来说,文档剖析功能件152可经配置以从文档164剖析文本的至少一部分及/或媒体对象(例如,图像、视频、音频片段)的一部分。文档剖析功能件152可经配置以解释从文档164剖析的一个或一个以上部分或者一个或一个以上部分的群组。

在一些实施例中,举例来说,文档剖析功能件152可包含基于一个或一个以上本体结构及/或一个或一个以上语义规则定义的语言处理部分(例如,语言处理功能部分)。文档剖析功能件152的语言处理部分内所包含的本体结构及/或语义规则可由所述剖析功能件用来解释文档164的一部分。在一些实施例中,所述解释可基于在文档剖析功能件152内编码的概率规则(例如,与解释的概率匹配)。在一些实施例中,文档剖析功能件152可经配置以基于自然语言处理技术来解释文档164。

在一些实施例中,举例来说,文档剖析功能件152可包含可由剖析模块150用来处理(例如,以物理方式处理)文档164的各种工具。举例来说,文档剖析功能件152可包含可用来将纸质文档中所包含的文本及/或媒体转换为可由文档分析引擎110处理的电子格式的光学字符阅读机(OCR)功能件。在一些实施例中,举例来说,文档剖析功能件152可包含语音检测/辨识系统,其可将传播的声波及/或声波的数字化表示(例如,语音、音乐)变换为可接着由文档分析引擎110处理的文本。

在一些实施例中,剖析模块150的文档剖析功能件152可经配置以将文档164剖析(例如,剖析所述文档中所包含的文本及/或媒体)为可与模板162内所包含的章节对应的章节。在一些实施例中,文档剖析功能件152可经配置以重新布置(例如,移动、组合)文档164的若干部分,使得其与模板162内所包含的章节对应。换句话说,文档剖析功能件152可经配置以为与模板162进行比较而准备所述文档。在一些实施例中,举例来说,可通过剖析模块150基于模板162内的字之间的语义关系及/或章节之间的关系来重新布置文档164的若干部分。因此,可使解释与文档164的经重新布置部分(例如,所述文档的新部分,其是基于文档164的已被剖析并组合成所述新部分的原始部分定义的)相关联。此外,模板162及文档剖析功能件152可经定义使得其彼此兼容(例如,彼此一致、针对彼此而定制)。结合图4来论述与剖析功能件相关的更多细节。

模板162内的一个或一个以上章节可与一个或一个以上条件及/或可基于是否满足所述条件而执行(触发)的动作相关联。举例来说,模板162可包含可与一个或一个以上条件及/或一个或一个以上动作相关联的一个或一个以上模板章节。在一些实施例中,模板162的章节及相关联条件/动作可统称为模板策略。在一些实施例中,多个条件可与可和一条件对应的一动作及/或多个动作对应。在一些实施例中,条件/动作组合可称为策略偏好。

具体来说,可通过模板模块160基于模板162的章节与由剖析模块150对文档164的一部分的解释的比较而执行(及/或触发)一个或一个以上动作。举例来说,模板模块160可经配置以基于和所述文档的一(若干)部分的解释与模板162内的章节的比较是否满足一个或一个以上准则而执行(及/或触发)动作。虽然未展示,但在一些实施例中,可在可由模板模块160存取的数据库(例如,模板数据库)中定义由文档分析引擎110执行(及/或触发)的动作。

在一些实施例中,可由模板模块160响应于模板162的一部分(例如,章节)与由剖析模块150对文档164的解释的比较而执行(及/或触发)的动作可以是(例如)阻止及/或允许请求实体140对文档164的一个或一个以上部分的存取(例如,对其的检视特权、编辑特权)。在一些实施例中,文档分析引擎110可经配置以识别文档164的可需要(例如)由请求实体140进一步审查的某些部分。在一些实施例中,如果文档164为合同,那么文档分析引擎110可经配置以识别与所述合同相关联的应接受或拒绝的一个或一个以上条款或章节。在一些实施例中,文档分析引擎110可经配置以基于对文档164的处理而建议对文档164的改变。在一些实施例中,文档分析引擎110可经配置以基于文档164的内容而向(例如)请求实体140发送通知。

在一些实施例中,文档分析引擎110可经配置以向请求实体140提供对文档164的评估。举例来说,如果所述文档为合同,那么文档分析引擎110可将文档164的若干部分识别为比模板162的指定章节更具限制性或不如其具限制性。

在一些实施例中,文档分析引擎110(例如,文档分析引擎110的模板模块160)可(例如)向请求实体140提供关于所述动作中的任一者的选项。在一些实施例中,可将提供选项视为(或编码为)一动作。举例来说,文档分析引擎110可经配置以提供关于是否将阻止/允许对文档164的指定部分的存取的选项及/或关于接受/否定文档164的指定部分的选项。在一些实施例中,所述选项(及/或动作)可伴随有基于由文档分析引擎110对文档164的处理而定义的信息。举例来说,一个或一个以上选项可伴随有由文档分析引擎110确定的文档164的指定部分的突出部分及/或解释(例如,含义)。结合图3及图5来论述与和模板相关的条件及/或动作的更多细节。

在一些实施例中,可基于一个或一个以上主模板(还可称为主文档模板)来定义模板162(例如,模板162的具有相关联条件及/或动作的章节、模板162的与策略偏好相关联的章节)。在一些实施例中,可将模板162可存储于其中模板162可由模板模块160存取的模板数据库(未展示)中。在一些实施例中,可至少部分地基于请求实体140及/或不同于请求实体140的实体(未展示)的一个或一个以上偏好来定义模板162。在一些实施例中,模板模块160可基于用户偏好(例如,策略、条件)而将模板162(或模板162的一部分)应用于文档164的仅一部分。结合图2到图9来论述与模板相关的更多细节。

在一些实施例中,可基于与文档164相关联的一个或一个以上识别符及/或一个或一个以上条款来选择文档剖析功能件152(或其一部分)及/或模板162(例如,具有相关联条件及/或动作的章节)(以供在处理文档164时使用)。举例来说,文档分析引擎110可接收、解释并使用与文档164(例如,整个文档164)的一个或一个以上部分相关联的例如电子标签(例如,元数据、链接)的识别符及/或一个或一个以上条款(例如,题目/标题、段落)以选择文档剖析功能件152及/或模板162(或模板策略)。所述识别符及/或条款可由文档分析引擎110响应于来自文档分析引擎110的请求而接收及/或从文档164的一个或一个以上部分(及/或与文档164相关联的数据)提取。

举例来说,可基于与文档164相关联的文档类型以基于对来自文档164的识别符及/或条款的分析而选择由剖析模块150用来处理文档164的文档剖析功能件152(或其一部分)及/或由模板模块160用来处理文档164的模板162(或其一部分)。举例来说,如果将文档164的一个或一个以上部分识别为基于EULA文档类型而定义,那么剖析模块150可经配置以基于与EULA文档类型对应的剖析功能件(例如文档剖析功能件152)来确定文档164的所述部分的含义。同样地,模板模块160可经配置以基于文档164的所述部分是基于EULA文档类型定义而应用一个或一个以上模板(例如模板162)。在一些实施例中,文档分析引擎110可经配置以向请求实体140(或不同实体)呈现接受(例如,确认)选项或拒绝对所述模板及/或文档剖析功能件的选择(或所述选择的若干部分)的选项(例如,呈提示的选项)。在一些实施例中,文档分析引擎110可经配置使得请求实体140(或不同实体)可手动做出对文档剖析功能件及/或模板的选择(或越权控制由文档分析引擎110进行的自动选择)。

在一些实施例中,可在初级处理时间周期期间接收、解释并使用与文档164的一个或一个以上部分相关联的识别符及/或条款,使得可选择文档剖析功能件152及/或模板162(或模板策略)。换句话说,可基于对与文档164相关联的识别符及/或条款的分析而分别从文档剖析功能件库(图1中未展示)及/或模板库(图1中未展示)中选择文档剖析功能件152及/或模板162。在一些实施例中,可基于默认(或通用)文档剖析功能件(未展示)及/或默认(或通用)模板(未展示)来执行初级处理。在已选择文档剖析功能件162及模板152之后,于二级处理时间周期期间剖析模块150可使用文档剖析功能件162及/或模板模块160可使用模板152来处理文档164的部分。

在一些实施例中,所述文档分析引擎可以反复方式执行对文档164的处理。举例来说,在一些实施例中,可反复地执行由模板模块160及/或剖析模块150对文档164的分析以细化对文档164的分析。在一些实施例中,可在不同反复期间基于不同模板(未展示)执行由模板模块160进行的反复处理。在一些实施例中,可在不同反复期间基于不同文档剖析功能件(未展示)执行由文档剖析功能件152进行的反复处理。在一些实施例中,可基于由(例如)请求实体140定义的阈值条件来选择所述文档剖析功能件及/或所述模板。

在一些实施例中,对文档164的第一分析可产生第一结果层级(例如,层次分类)。对文档164的第二分析可产生基于所述第一结果层级或与其无关的第二结果层级。所述第一分析及所述第二分析可由文档分析引擎110使用不同或相同模板及/或不同或相同文档剖析功能件来执行。在一些实施例中,文档分析引擎110可经配置以多次分析文档164并提示用户(例如,请求实体140)选择所述分析的结果中的一者或一者以上。

虽然图1中未展示,但在一些实施例中,剖析模块150及/或模板模块160可将不同文档剖析功能件(或其若干部分)及不同模板(或其若干部分)应用于文档164的不同部分。举例来说,如果文档分析引擎110确定文档164的第一部分与EULA对应(例如,为EULA文档类型)且文档164的第二部分与不动产合同对应(例如,为不动产合同文档类型),那么可基于与所述EULA相关联的文档剖析功能件来处理文档164的第一部分且可基于与所述不动产合同相关联的文档剖析功能件来处理文档164的第二部分。

在一些实施例中,可基于用户(例如请求实体140)的偏好来选择一个或一个以上文档剖析功能件及/或一个或一个以上模板。举例来说,所述用户可定义可由文档分析引擎110用来先于另一模板而选择一个或一个以上模板或先于另一文档剖析功能件而选择一个或一个以上文档剖析功能件的优先级偏好。在一些实施例中,可定制一个或一个以上文档剖析功能件及/或模板且使其与和请求实体140相关联的识别符相关联。换句话说,可使定制的文档剖析功能件及/或模板与使用所述识别符的请求实体140相关联。响应于来自请求实体140的对处理文档164的请求,文档分析引擎110可使用所述识别符来提取所述定制的文档剖析功能件及/或模板,使得可基于所述定制的文档剖析功能件及/或模板来处理文档164。

在一些实施例中,文档164可与目标内容(未展示)相关联,且可响应于由请求实体140对存取所述目标内容的请求而触发对文档164的处理。举例来说,所述目标内容可为可下载或与网页(例如,网页内所包含的内容)相关联的应用程序,且文档164可为与所述目标内容相关联(例如,在其中提及的、链接到其的)的条款和条件合同及/或EULA。在一些实施例中,除了文档164以外,还可分析所述目标内容的一个或一个以上部分(在此情况下,所述目标内容可称为文档)。

由文档分析引擎110相对于文档164执行(及/或触发)的动作及/或选项(其可以是动作)中的任一者也可应用于所述目标内容。举例来说,文档分析引擎110(例如,文档分析引擎110的模板模块160)可基于对文档164的处理而(例如)阻止及/或允许(由请求实体140或不同实体)对所述目标内容的一个或一个以上部分的存取。在一些实施例中,如果文档164为合同,那么文档分析引擎110可经配置以在存取所述目标内容之前识别与所述合同相关联的可/应接受或拒绝的一个或一个以上条款或章节。在一些实施例中,文档分析引擎110可经配置以基于文档164的与所述目标内容相关联的内容而向(例如)请求实体140发送关于所述目标内容的通知。

在一些实施例中,可用来选择文档剖析功能件152(例如,从文档剖析功能件库中选择)及/或模板162(例如,从模板库中选择)的识别符及/或条款可与所述目标内容相关联。举例来说,所述识别符及/或条款可与用来存取所述目标内容或所述目标内容内所包含的链接(例如,超链接、统一资源定位符(URL))(如果所述目标内容为网页)相关联。

在一些实施例中,文档分析引擎110的一个或一个以上部分可为基于硬件的模块(例如,数字信号处理器(DSP)、现场可编程门阵列(FPGA))及/或基于软件的模块(例如,可在处理器(其可与存储器相关联)处执行的计算机代码、计算机可读指令集合的模块)。在一些实施例中,举例来说,可将文档分析引擎110编码于可安装于(例如)个人计算机上及/或供应给其的应用程序(例如,基于java的应用程序、基于web的应用程序)内。可将由文档分析引擎110执行的操作(例如,功能)中的任一者包含于一个或一个以上模块内。举例来说,可将由剖析模块150及/或模板模块160执行的一个或一个以上操作组合到单个模块中或划分在多个模块(包含未展示的模块)中。

虽然未展示,但在一些实施例中,可使得文档分析引擎110作为web服务使用。举例来说,可经由web浏览器调用文档分析引擎110。在一些实施例中,可经由与(例如)请求实体相关联的帐户(例如,用户帐户)来接入文档分析引擎110。在一些实施例中,可经由应用编程接口(API)用到及调用与文档分析引擎110相关联的功能性。

在一些实施例中,由文档分析引擎110执行的操作中的任一者可由(例如)请求实体140(或不同实体)手动触发。在一些实施例中,由文档分析引擎110执行的操作中的任一者可由除请求实体140以外的实体(未展示)触发。举例来说,可将动作及/或选项呈现给不同于请求实体140的实体。在一些实施例中,模板(例如模板162)及/或文档剖析功能件(例如文档剖析功能件152)的一个或一个以上部分可由不同于请求实体140的实体定义。

在一些实施例中,文档提供者180可为可将文档164发送(例如,传输、提供)到文档分析引擎110以供处理的任一实体。在一些实施例中,文档提供者180可经配置以按可由文档分析引擎110兼容地处理的格式及/或基于可由文档分析引擎110兼容地处理的协议将文档164发送到文档分析引擎110。在一些实施例中,文档分析引擎110可具有经配置以将文档164转换(例如,变换)为可由文档分析引擎110兼容地处理的格式(例如,协议)的一个或一个以上模块。在一些实施例中,文档提供者180可以是(例如)有线装置及/或无线装置,举例来说,计算实体(例如,个人计算装置)、移动电话、个人数字助理(PDA)及/或服务器(例如,web服务器/主机)。

举例来说,网络170可以是局域网络(LAN)及/或广域网络(WAN)。在一些实施例中,网络170可包含一个或一个以上有线及/或无线段。虽然未展示,文档分析引擎110、文档提供者180及/或请求实体140可包含于单个计算环境(例如,个人计算机)内。虽然未展示,但在一些实施例中,可经由(例如)通用串行总线(USB)端口或不同端口(例如,火线端口)在计算机处接收文档。可经由扫描仪扫描所述文档并经由所述USB端口将其传输到所述计算机。可通过安装于所述计算机处或从所述计算机接入(例如,经由网络)的文档分析引擎来分析所述文档。

在一些实施例中,文档分析引擎110可经配置以分析包含与各种语言及/或文化相关的文本及/或图像的文档。在一些实施例中,举例来说,文档剖析功能件152可经配置以变换文档164的一个或一个以上部分以供与模板162的章节进行比较。

在一些实施例中,文档分析引擎110的任一部分可经配置以允许、提示及/或需要人类互动(例如,干预)。举例来说,文档分析引擎110可经配置以提示用户进行所述用户对由文档分析引擎110采取的任一动作的批准或所述用户对所述动作的手动干预(例如,编辑、选择)。

图2是图解说明根据实施例由用户240使用模板定义模块220定义的模板274的示意性框图。模板274可称为模板274集合或模板274库。模板274是基于主模板210而定义的,且在一些实施例中,模板274中的每一者可称为子模板或定制模板。模板274包含模板A、模板B及模板C,且主模板210包含主模板D、主模板E及主模板F。举例来说,在此实施例中,模板A是由用户240经由模板定义模块220基于主模板D而定义。此外,在此实施例中,模板C及模板G是由用户240经由模板定义模块220基于主模板F而定义。在一些实施例中,用户240可以是请求实体。在一些实施例中,模板210可称为用户特定模板210。

在此实施例中,模板274包含于可由模板模块260存取的模板数据库270中。在一些实施例中,模板数据库270可存储于例如本地存储器(例如,硬盘驱动器、随机存取存储器(RAM))的存储器及/或可(例如)经由网络存取的分布式数据库中。

模板274中的每一者可包含可由模板模块260在处理文档(例如图1中所展示的文档164)的一个或一个以上部分时使用的条件及/或动作(例如,策略偏好)。在一些实施例中,模板274可包含回到主模板210(及/或主模板210内所包含的条件及/或动作)的参考(例如,指示符)。在此类实施例中,主模板210(及/或相关联条件/动作)可存储于其中其可由模板模块260在处理文档时存取的位置中(例如,在文档分析引擎110处)。

虽然未展示,但在一些实施例中,模板定义模块220可包含于文档分析引擎(例如,图1中所展示的文档分析引擎110)内。因此,所述文档分析引擎可不仅用于定义模板(及相关联动作/条件),且还可用于基于所述模板来处理(例如,分析)文档。

图3是图解说明根据实施例基于主合同模板300定义的用户特定合同模板310的示意性框图。所述主合同模板包含三个合同章节345:合同章节1、合同章节2及合同章节3,其各自与各种条件及动作组合(策略偏好)相关联。主合同模板300中的合同章节1与三个不同条件/动作组合E、F及G相关联。合同章节2具有两个条件一条件I及条件J一与单个动作K相关联。合同章节3具有单个条件L、与三个不同动作M、N及K相关联。

合同章节345可包含与合同的不同规定及/或条项相关联的文本(例如,数字化文本)及/或媒体(例如,图像、视频、音频)。举例来说,所述规定(其还可称为类别)可包含(例如)可分性规定(或条项)、法律选择规定(或条项)、保证规定(或条项)、赔偿规定(或条项)、保密性规定(或条项)等等。

如图3中所展示,用户特定合同模板310包含来自主合同模板300的合同章节345及条件/动作的子集合。具体来说,用户特定合同模板310包含与条件/动作E相关联的合同章节1以及与条件I及动作K相关联的合同章节2B。在此实施例中,合同章节2B为合同章节2的经修改版本。来自主合同模板300的合同章节3未包含于用户特定合同策略310中。

如图3中所指示,用户特定合同模板310是基于用户从主合同模板300中的选择而定义的。在一些实施例中,所述用户所做的选择可经由模板定义模块(例如图2中所展示的模板定义模块220)执行。在一些实施例中,可能不允许在定义用户特定合同策略时修改合同章节345中的一者或一者以上(例如,将合同章节2修改为合同章节2B)。

在一些实施例中,可基于用户所做的全局选择来定义策略偏好(条件/动作对)集合。举例来说,可选择条件/动作E、条件J/动作K及条件L/动作M并使用其来基于到此策略偏好集合的单个可选择链接来定义用户特定合同(未展示)。

图4是图解说明根据实施例的与主模板445集合相关联且与定制模板447集合相关联的文档剖析功能件450集合的示意性框图。来自定制模板447集合的每一模板是基于来自主模板445集合的至少一个模板而定义的。文档剖析功能件Q与主模板S(及基于主模板S定义的定制模板)以及主模板T(及基于主模板T定义的定制模板)相关联,且文档剖析功能件R与主模板U(及基于主模板U定义的定制模板)相关联。

在一些实施例中,主模板445中的每一者可基于文档类型而定义。在一些实施例中,主模板445可基于用来定义剖析功能件450的本体及/或语义规则而定义。举例来说,剖析功能件R及与剖析功能件R相关联的主模板U(例如,主模板U及T内的章节)可基于经定义用于处理EULA的本体及/或语义规则而定义。换句话说,所述文档模板(例如,主模板445及定制模板447)可经定义使得其与编码于剖析功能件450内的分析过程兼容(例如,与其一致)。因此,如果经选择以供分析的文档为EULA,那么可使用剖析功能件R及主模板U来分析所述EULA。

图5是图解说明根据实施例的用于基于合同模板来分析合同的一部分的方法的流程图。在一些实施例中,可使用(例如)文档分析引擎来实施所述方法。如图5中所展示,在500处接收合同的一部分。可响应于来自用户(例如,请求实体)的请求而接收所述合同的与所述合同相关联的部分且其可包含文本及/或媒体。所述合同的所述部分可与(例如)从web服务器供应的web内容相关联。在一些实施例中,所述合同的所述部分可为所述合同内的条款、可为所述合同的规定、可为整个合同、可与多个合同相关联等等。

如图5中所展示,在510处确定合同类型。在一些实施例中,可基于与所述合同的所述部分相关联的条款(例如,单个字、若干字的集合)及/或基于与其相关联的识别符来确定所述合同类型。

如果在510处无法确定合同类型,那么可执行及/或触发动作。举例来说,在一些实施例中,可通知用户无法分析所述合同的所述部分。在一些实施例中,可将所述合同的所述部分的一个或一个以上部分提供给所述用户及/或可提示所述用户相对于所述合同的所述部分做出手动决策。在一些实施例中,所述用户可触发(例如)文档分析引擎忽略所述合同的无法分析的部分。在一些实施例中,可不通知所述用户无法确定合同类型及/或可通过(例如)文档分析引擎自动处置所述合同的所述部分。举例来说,文档分析引擎可经配置以自动忽略所述合同的所述部分的无法分析的部分。

在520处基于所述合同类型而选择合同模板。在一些实施例中,所述合同模板可为基于主合同模板定义的合同模板。所述合同模板可包含可与条件及/或动作相关联的一个或一个以上章节。

在530处基于所述合同类型而选择合同剖析功能件。在一些实施例中,可基于在520处选择的合同模板来选择所述合同剖析功能件。换句话说,可在选择所述合同模板时自动选择与所述合同模板对应的合同剖析功能件。

在一些实施例中,如果无法使合同模板及/或合同剖析功能件与所述合同的所述部分相关联,那么可通知用户。举例来说,如果用于特定合同类型的合同模板尚未由所述用户创建,那么可通知所述用户无法识别合同模板。在此类情形下,举例来说,文档分析引擎可经配置以自动忽略所述合同的所述部分、基于不同合同模板(例如,默认合同模板)及/或不同合同剖析功能件(例如,默认合同剖析功能件)分析所述合同的所述部分、向所述用户提供用于处置所述情形的选项(例如,手动触发的选项)(例如,用于忽略所述合同的所述部分的选项等)等等。

在540处基于所述合同剖析功能件而确定所述合同的所述部分的含义。换句话说,可基于所述合同剖析功能件来解释所述合同的所述部分。如果所述合同的所述部分包含文本,那么可基于与所述合同剖析功能件相关联的一个或一个以上本体及/或与所述合同剖析功能件相关联的一个或一个以上语义规则来确定所述含义。在一些实施例中,可针对所述合同类型具体地定义所述一个或一个以上本体。

在550处使所述合同的所述部分的含义与所述合同模板的章节相关联并将其与所述章节进行比较。所述章节可与合同规定或合同条款(例如,定义条款的单个字、定义条款的若干字的集合)相关联。

在一些实施例中,如果在540处无法基于所述合同剖析功能件合意地确定(例如,在指定阈值准确度内确定)所述合同的所述部分的至少一部分的含义及/或在550处无法使所述含义与所述合同模板的章节相关联,那么可执行及/或触发一个或一个以上动作。举例来说,在一些实施例中,可经由(例如)用户接口提示来通知用户所述问题。在一些实施例中,可自动忽略所述合同的无法解释的部分(或所述合同的所述部分的无法解释的一部分)。在一些实施例中,可向用户呈现所述合同的所述部分的无法分析(例如,解释)的一个或一个以上部分及/或可向用户呈现用于处置所述合同的所述部分的选项(例如,手动触发的选项)(例如,用于忽略文本的所述部分的选项等)。在一些实施例中,可基于一个或一个以上不同合同剖析功能件来分析所述合同的所述部分直到(例如)可确定所述合同的所述部分的含义为止。

在560处,当满足至少一个条件时,基于所述合同的所述部分的含义与所述合同模板的所述章节的比较而执行动作。举例来说,如果所述合同模板的所述章节与所述合同的所述部分的比较满足所述条件,那么可自动阻止及/或允许对与所述合同的所述部分相关联的内容的一个或一个以上部分的存取(例如,对其的检视特权、编辑特权)。举例来说,如果所述合同的所述部分的含义实质上不同于所述合同模板的所述章节,那么可通知用户及/或可建议对所述合同的所述部分的改变。在一些实施例中,如果所述合同的所述部分的含义实质上不同于所述合同模板的所述章节,那么可防止用户检视与所述合同的所述部分相关联的内容。

虽然图5是与对合同的一部分的分析相关的流程图,但在一些实施例中,可使用所述流程图来分析可与不同类型文档(例如书或期刊文章)相关联的文本及/或媒体。在一些实施例中,所述方法的一个或一个以上部分可以不同次序执行及/或可需要人类互动以便继续进行。举例来说,在一些实施例中,在基于所述合同类型选择所述合同模板(520处所展示)之前,可基于所述合同类型来选择所述合同剖析功能件(530处所展示)。在此类情形下,可基于所选择的合同剖析功能件来选择所述合同模板。在一些实施例中,在所述合同模板用于分析所述合同的一个或一个以上部分之前,所述合同模板必须经用户批准。

图6是图解说明根据实施例的经配置以分析合同620的若干部分的文档分析引擎610的示意性框图。具体来说,基于从剖析功能件数据库650接收的剖析功能件652且基于来自合同模板数据库660的主合同模板600来分析合同620的部分624及部分622。所述文档分析引擎包含剖析模块612、模板模块614及偏好模块616。

在剖析模块612处基于剖析功能件652来解释合同620的部分624。使用模板模块614将与部分624相关联的含义与主合同模板600的合同章节602进行比较。如图6中所展示,合同章节602与两个不同条件/动作组合一条件/动作A1及条件/动作A2相关联。条件/动作A1是基于由偏好模块616应用的用户偏好618从主合同模板600中选择的。不是基于定制合同模板(基于主合同模板600而定义)来分析合同620,而是基于主合同模板600与用户偏好618的组合以动态方式分析合同620。在一些实施例中,用户偏好618可为用来定义策略偏好集合的全局偏好。

在剖析模块612处基于剖析功能件652来解释合同620的部分622。在此实施例中,合同620的部分622不与来自主合同模板600的特定合同章节相关联。由于无法将与部分622相关联的含义和主合同模板600中所包含的合同章节中的任一者进行比较,因此执行默认条件/动作。

图7是图解说明根据实施例经配置以响应于由第二实体(实体X)请求的对文档782的分析而与第一实体(实体Y)通信的文档分析引擎710的示意性框图。在一些实施例中,文档782可为文档的一部分。在此实施例中,响应于来自实体X的请求762而触发在文档分析引擎710处对文档782的分析。文档提供者780经由网络770将文档782提供给文档分析引擎710。在一些实施例中,文档分析引擎710可经配置以基于对文档782的分析而执行/触发动作。

如图7中所展示,文档分析引擎710经配置以响应于由实体X提示的对文档782的分析而将信号766发送到实体Y。换句话说,文档分析引擎710可经配置以即使对文档782的分析是由实体X(其为不同(及/或独立)实体)触发也将信号766发送到实体Y。

在一些实施例中,信号766可与基于订阅而发送到实体Y的通知相关。换句话说,实体Y可订阅接收基于与例如文档782的文档相关的特定事件的通知。在一些实施例中,文档分析引擎710可经配置以按订阅中所指令的那样相对于(例如)文档782执行(及/或触发)动作(例如,忽略、接受)。在一些实施例中,替代信号766或除了其以外,可执行(及/或触发)所述动作。

举例来说,在一些实施例中,实体Y可向文档分析引擎710注册(在订阅中)以在检测到文档782的改变的情况下被通知。可响应于文档分析引擎710检测到文档782的改变而将信号766发送到实体Y(在由实体X提示分析文档782之后)。可基于文档782的所存储副本(例如,经高速缓存副本)来检测所述改变。信号766可包含与所述改变相关的信息(例如,改变的类型、改变的评估(更具限制性的语言、较不具限制性的语言等))。在一些实施例中,当检测到对任一文档(或任一文档的若干部分)的某一等级的改变时,文档分析引擎710可基于接收通知的订阅而向实体Y发送通知。

在一些实施例中,文档分析引擎710可经配置以在先前已由实体Y请求进行分析的文档(例如文档782)稍后响应于来自不同实体(例如实体X)的请求而经分析时将信号766(例如,通知信号)自动发送到实体Y。具体来说,文档分析引擎710可经配置以追踪(例如,收集、存储)与实体Y所做的文档分析请求相关的信息,且可使用所述所追踪的数据(还可称为历史数据)来稍后通知实体Y对先前被请求进行分析的文档的改变。因此,信号766可为基于与由实体Y请求进行分析的文档相关的历史数据而产生的信号。在一些实施例中,文档分析引擎710可经配置以在已对先前由实体Y请求进行分析的文档做出改变时通知实体Y。在一些实施例中,文档分析引擎710可基于所述文档的经高速缓存副本而提供所述改变的评估。文档分析引擎710可经配置以将所追踪的数据存储于(例如)本地存储器(未展示)及/或远程数据库(未展示)中。

在一些实施例中,可由实体Y定义与通知相关的阈值条件。举例来说,实体Y可订阅仅在多于指定百分比的文档782已改变时或仅在文档782的指定部分(例如,若干章节的集合)具有改变时接收通知。在一些实施例中,实体Y可订阅仅在多于指定百分比的文档782已改变时或仅在文档782的指定部分(例如,若干章节的集合)已改变时接收通知。

图8是图解说明根据实施例用于响应于更新请求而分析合同的一部分的方法的流程图。如图8中所展示,响应于更新请求而在文档分析引擎处接收合同的至少一部分。所述更新请求可为对确定特定文档(例如与特定网站相关联的EULA)从最后分析以来是否已改变(如在由(例如)文档分析引擎追踪的历史数据中所指示)的请求。

在810处,所述文档分析引擎经配置以确定所述合同的所述部分已改变。可基于存储于所述文档分析引擎处的历史数据来确定所述文档的改变。举例来说,在一些实施例中,可将所述合同的所述部分与所述合同的所述部分的存储于所述文档分析引擎处(或不同于所述文档分析引擎的位置处)的图像(例如,副本)进行比较。

在820处基于合同模板且基于剖析功能件而分析所述合同的所述部分。所述合同模板及/或所述剖析功能件可由(例如)所述文档分析引擎基于与所述合同的所述部分相关联的合同类型来检索。

在一些实施例中,如果未检测到所述文档的所述部分的改变,那么可不基于所述合同模板及/或基于所述剖析功能件来分析所述文档。换句话说,如果未检测到所述文档的所述部分的改变,那么可不采取动作。在一些实施例中,举例来说,所述文档分析引擎可经配置以登记(例如,记录/存储日期时间戳)对所述文档的所述部分的处理及/或高速缓存所述文档的副本以建立与对所述文档的所述部分的改变相关的历史以供将来分析。

在830处响应于所述分析而执行动作。在一些实施例中,举例来说,可通知用户所述文档的经更新部分与所述文档的所述部分的先前图像(或所述文档的所述部分的一个或一个以上历史副本)之间的差异的细节。在一些实施例中,可基于所述分析而防止用户稍后存取与所述文档相关联的目标内容。换句话说,所述分析可存储于存储器中且用于在稍后请求所述目标内容时阻止存取。

图9是图解说明根据实施例两个策略度量-度量920及度量930-对时间的趋势的示意性曲线图。所述策略度量可为用来图解说明随时间对文档做出的改变的度量。举例来说,策略度量920可与随时间文档内的限制程度(例如,EULA内的条款性质)相关,且策略度量930可与随时间对文档的改变百分比(逐个字地)相关。文档分析引擎可经配置以使用与对一个或一个以上文档的分析(例如,对所述文档的解释)相关的历史数据来产生所述曲线图。

本文中所描述的一些实施例涉及具有其上有用于执行各种计算机实施的操作的指令或计算机代码的计算机可读媒体(还可称为处理器可读媒体)的计算机存储产品。所述媒体及计算机代码(还可称为代码)可以是经设计及经构造以用于特定目的的那些媒体及计算机代码。计算机可读媒体的实例包含(但不限于):磁性存储媒体,例如硬盘、软盘及磁带;光学存储媒体,例如光盘/数字视盘(CD/DVD)、光盘只读存储器(CD-ROM)及全息装置;磁光存储媒体,例如光学磁盘;载波处理系统;以及硬件装置,其经特别配置以存储及执行程序代码,例如专用集成电路(ASIC)、可编程逻辑装置(PLD)及只读存储器(ROM)以及随机存取存储器装置。计算机代码的实例包含(但不限于):微代码或微指令、机器指令(例如由编译器产生)、用来产生web服务的代码及含有由计算机使用解释器执行的较高级指令的文件。举例来说,可使用Java、C++或其它程序设计语言(例如,面向对象的程序设计语言)及开发工具来实施实施例。计算机代码的额外实例包含(但不限于):控制信号、经加密代码及经压缩代码。

尽管上文已描述各个实施例,但应理解,其仅以实例的方式而非限制的方式呈现,且可做出各种形式及细节上的改变。本文中所描述的设备及/或方法的任一部分可组合成除互相排斥的组合外的任一组合。本文中所描述的实施例可包含所描述的不同实施例的功能、组件及/或特征的各种组合及/或子组合。举例来说,在合同分析的背景中描述的实施例中的任一者可广泛应用于分析任一类型文档。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号