首页> 中国专利> 法庭用系统,法庭用方法,以及法庭用程序

法庭用系统,法庭用方法,以及法庭用程序

摘要

利用本发明可以减轻校阅者在校阅法庭文件时,判断关联性时的负荷。其包括:显示部,由前述数字信息中包含的多个文件所组成的文件群中,将至少一个以上的文件对利用者加以显示;识别信息接收部,在前述文件群之中,针对前述利用者判断是否为与诉讼相关联的文件,也就是对象文件,根据前述利用者判断是否与诉讼相关联的结果,加上识别信息,该识别信息接收部用来接收前述识别信息;评分更新部,将接收到前述识别信息的对象文件的特征量,和前述文件群中的文件的特征量作比较,根据比较结果,对应于设定的识别信息,来更新前述文件群中的文件的评分;和显示控制部,根据前述更新后的评分,来控制前述显示部所显示的前述文件群中的文件的显示顺序。

著录项

  • 公开/公告号CN104885116A

    专利类型发明专利

  • 公开/公告日2015-09-02

    原文格式PDF

  • 申请/专利权人 UBIC股份有限公司;

    申请/专利号CN201380052902.3

  • 发明设计人 守本正宏;白井喜胜;武田秀树;

    申请日2013-10-09

  • 分类号

  • 代理机构上海波拓知识产权代理有限公司;

  • 代理人杨波

  • 地址 日本东京都港区港南2-12-23明产高滨大楼7楼

  • 入库时间 2023-12-18 10:40:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-23

    未缴年费专利权终止 IPC(主分类):G06Q50/18 专利号:ZL2013800529023 申请日:20131009 授权公告日:20170711

    专利权的终止

  • 2017-07-11

    授权

    授权

  • 2015-09-30

    实质审查的生效 IPC(主分类):G06Q50/18 申请日:20131009

    实质审查的生效

  • 2015-09-02

    公开

    公开

说明书

技术领域

本发明有关于一种法庭用系统,法庭用方法,以及法庭用程序,特别 地,是一种关于用来收集诉讼相关联的文件信息的法庭用系统,法庭用方 法,以及法庭用程序。

背景技术

以往,非法存取或是机密信息泄漏等等关于计算机的犯罪或法律纷争 产生之际,在原因究明或者是在捜查上,都会将必要的机器或数据,以及 电子记录加以取集、分析,在此,本发明提供一种作为法律上明显的证据 性的手段或技术的提案。

特别的是,在美国民事诉讼当中,都被要求进行电子证据揭露 (eDiscovery),无论是该当诉讼的原告以及被告,任何另一方面都负有 将相关的数字信息作为证据加以提出的责任。因此,必须把记录在计算机 或者是器中的数字信息作为证据,加以提出。

另一方面,随着信息科技的急速发达与普及,今日的商业世界中几乎 所有的信息都是用计算机做成的,即使是在同一企业内,也泛滥着许多的 数字信息。

因此,在进行对法庭提出证据数据的准备作业过程中,就连与该当诉 讼不见得有关系的机密的数字信息,也容易会有被当作证据数据而提出去 的失误。还有,把与该当诉讼没关系的机密文件信息提出去,会造成问题。

近年,在法庭立证系统中,与文件信息相关的技术,在专利文献1~ 3中被提案出来。专利文献1中,揭示了一种法庭用系统,由文件提出命 令的对象者信息中,所包含至少1人以上的对象者中,选择特定的对象, 根据被指定的特定的对象所相关的存取履历信息,只针对该特定的对象所 存取的数字文件信息加以抽出,被抽出的数字文件信息的文件档案,分别 设定其显示是否与诉讼相关联的附带信息,根据该附带信息,将与诉讼相 关联的文件档案予以输出。

还有,在专利文献2中,揭示了一种法庭用系统,显示其被记录的数 字信息,对多个文件档案逐一地,在对象者信息所包含的对象者之中,显 示与任一对象者是否相关联于对象者特定信息,设定此对象者特定信息, 再将该被设定的对象者特定信息,设定成储存在记忆部中,指定其中至少 一人以上的对象者,对应于该被指定的对象者,检索其所被设定存取的对 象者特定信息之文件档案,透过显示部,针对被检索的文件档案,设定其 显示是否与诉讼相关联的附带信息,根据该附带信息,将与诉讼相关联的 文件档案予以输出。。

再者,在专利文献3中,接收数字文件信息所包含至少1个以上的文 件档案的指定,将被指定的文件档案指定翻译成的其中一种言语,接收此 指定,将接收该指定的文件档案,翻译成所接收指定的言语,再从储存在 记录部中的数字文件信息中,将显示为与被指定的文件档案相同内容的共 通文件档案予以抽出,该被抽出的共通文件档案,通过援用其所翻译成的 文件档案的翻译内容,来生成其显示翻译结果的翻译关联信息,再根据该 翻译关联信息,输出该与诉讼相关联的文件档案。

现有技术文献

专利文献1日本特开2011-209930号公报

专利文献2日本特开2011-209931号公报

专利文献3日本特开2012-32859号公报

发明内容

可是,例如,从专利文献1到专利文献3,这样的法庭用系统中,利 用了多个计算机以及服务器,来收集对象者的膨大的文件信息。

像这样把被数字化的巨大的文件信息,当作是诉讼的证据数据,来区 别是否妥当的作业,要靠着被称之为校阅者的使用者以人工目视来确认, 必须把该当文件信息一个一个的加以区别,会有花费极大的劳力和费用的 问题。

因此,本发明有鉴于上述的状况,为了减轻校阅者的校阅的负荷,提 供一种法庭用系统,以及法庭用方法,和法庭用程序。

本发明的法庭用系统,取得多个计算机或服务器中所记录的数字信 息,并分析该取得的数字信息的法庭用系统,其包括:

一显示部,由前述数字信息中包含的多个文件所组成的文件群中,将 至少一个以上的文件对利用者加以显示;

一识别信息接收部,在前述文件群之中,针对前述利用者判断是否为 与诉讼相关联的文件,也就是对象文件,根据前述利用者判断是否与诉讼 相关联的结果,加上识别信息,该识别信息接收部用来接收前述识别信息;

一评分更新部,将接收到前述识别信息的对象文件的特征量,和前述 文件群中的文件的特征量作比较,根据比较结果,对应于设定的识别信息, 来更新前述文件群中的文件的评分;和

一显示控制部,根据前述更新后的评分,来控制前述显示部所显示的 前述文件群中的文件的显示顺序。

所谓「文件」,是指包含有一个以上的单字的数据。文件的例子有: 电子邮件,简报数据,窗体计算数据,协商数据,契约书,组织结构,商 业计划书等。还有,文件有对应于逐个的识别信息的评分,该评分是,从 针对文件群中的各文件所事先加上的初期评分开始,把识别信息相关联的 对象文件与各文件的特征量相比较,根据该比较结果,将计算出来的值, 利用加分或扣分的方式予以计算,再加以更新。

「文件群」是指,由多个文件所构成的数据。

「显示部」是指,用来对利用者提示文件的界面。显示部中所显示的 文件,是与利用者的诉讼是否相关联的判断对象。判断其是否与该诉讼为 相关联的判断行为,称之为「校阅」。校阅是,把成为校阅的对象的文件 (在此称之为对象文件),其与诉讼的关联程度,或根据其与诉讼的关联 对策,分类成多个种类,再对每个种类,加上识别信息。

「显示控制部」是指,针对显示部,利用通讯来传递指令,进而控制 所显示的文件的顺序。例如,可以依照文件所具有的评分的升幂顺序,控 制使其显示于显示部上。

「识别信息接收部」是,利用者通过校阅,来接收其加在对象文件上 的识别信息。

「识别信息」,被加在其成为分类对象的文件上,让诉讼上的利用更 为容易,用来显示与诉讼之间的关联性。识别信息也可以记录成在各文件 上的附带信息,也可以把识别信息与文件的对应关系记录在数据库上。识 别信息可以是,例如,显示与诉讼相关联的「Responsive」,特别是在诉 讼中被显示为重要文件的「HOT」的信息,至于与这次诉讼无关的文件也 可以用「Non-Responsive」等的关键词来表示。

「评分更新部」是,把识别信息接收部所接收到的识别信息的对象文 件的特征量,和文件群中所包含的文件的特征量,作一比较,将对应于该 接收到的识别信息的评分,进行更新。还有,评分更新部,也可以使用文 件中频频出现的各单字的种类,各单字所具有的评价值,以及各单字的出 现次数所构成的倾向信息,来算出特征量。评分更新部,例如,对应于特 征量的一致度,可以对评分再进行加分或扣分。对于成为比较对象的文件, 可以包含对象文件本身,也可以将对象文件予以排除。例如,当对象文件 本身包含在比较对象中的时候,由于特征量会完全一致,所以对相应的点 的评分,可在加分后再予以更新。

所谓「评分」,是指将文件与识别信息相结合的程度,作一个定量的 评价。各文件,也可以在数据库上,把逐一对应于设定的识别信息的评分, 予以记录。例如,在校阅过程中,各文件利用识别信息为「HOT」, 「Responsive」或「Non-Responsive」之三个识别信息,加以分类为例进 行说明。这时候,各文件在数据库上,可以确保记录有「HOT」评分, 「Responsive」评分以及「Non-Responsive」评分之三个不同评分的范围。 然后,在上述3个种类的评分当中,如果超过设定的界限值的话,可以对 其加上超过界限值的识别信息。

各文件,可以根据一定的要件,来给定初期评分。例如,可以利用文 件中出现的单字,与各单字所具有的评价值,来算出初期评分。还有,也 可以在全部文件共同一致之后,把某个一定的值当作是初期评分加上去。 由初期评分开始,进行加分或扣分的处理,来更新评分。

「特征量」是指,用来测定各文件间的类似度的数字。特征量,是使 用在文件中频频出现的各单字的种类,各单字所具有的评价值,以及各单 字的出现次数所构成的倾向信息,也可以是通过评分更新部来加以算出。 再者,评分更新部,也可以在算出特征量之际,参考该单字的传达信息量。

还有,本发明的法庭用系统,还包括:

一排除判定部,将前述评分达到特定的值的文件,利用前述显示部, 把从被显示出来的文件的候补中,判定其予以排除;和

一控制部,在前述被判定文件的数量还没有超过设定的值之前,将前 述显示部,前述识别信息接收部,前述评分更新部,前述显示控制部,和 前述排除判定部的处理,控制为可反复执行。

「排除判定部」是指,在对评分进行更新之际,对于那些更新后的评 分达到特定的值的文件,会在由显示部上所显示的文件的候补对象中,判 定予以排除。排除判定部,也可以在排除判定的前段,对每个识别信息进 行结束的判定。例如,在校阅过程中,排除判定部,对上有加上3种识别 信息时,可以把这3种全部有结束判定的识别信息的文件,由对象文件的 候补中予以排除。还有,排除判定部,对只有一个识别信息的评分超过特 定值时,对当该识别子被判定结束之际,也可以针对该超过特定值的识别 信息,把结束判定的意旨的显示,加在当该文件。再者,排除判定以及结 束判定,把特定的值作为界限值时,有两个值亦无妨。例如,评分由于加 分而超过该2个界限值的其中一个值时,或评分由于扣分而低于另一个界 限值时,仍可以进行排除判定以及结束判定。

「控制部」的作用在于:将显示部,识别信息接收部,评分更新部, 和排除判定部的处理,控制为可以反复执行。该控制,也可以是从一开始 就逐个地处理,循环地反复地进行的手段。还有,控制部,也可以用批次 性地处理一定数量之后,再执行后段的处理,以逐单位地反复进行。控制 部,在将文件群或对象群组所包含的全部文件都判定而加以排除时,就是 完成了控制处理。

还有,本发明中的法庭用系统,还包括:一自动付与部,针对文件群 中的文件,根据被更新后的评分,来自动加上识别信息。

「自动付与部」,是将各文件中,因应其评分,自动地加以判断,加 上适当的识别信息。自动付与部中,也可以对识别信息的每个种类,逐一 设置界限值,对于超过该界限值的文件,加上识别信息。

还有,本发明中的法庭用系统,还包括:一数据库,针对前述文件群 中所包含的文件,将对应于前述识别信息的评分予以记录,每当前述评分 更新部对评分进行更新时,将前述每个识别信息的评分予以更新。在数据 库中,也可以储存:文件,加上去的识别信息,对应于各识别信息的评分, 以及超过界限值的信息等。

还有,本发明中的法庭用系统,还包括有一分类部,根据设定文件群 的要件,分类成各个群组,从该些群组中,至少选一个来作为处理对象, 也就是成为对象群组。显示部,也可以从分类部所选择出来的对象群组中, 由对利用者所显示的文件群中予以抽出。

「设定的要件」是指,成为分类的条件。设定的要件,也可以由利用 者用自己的意思来任意加以决定。设定的要件,例如,可以是文件所做成 的年代,文件的扩张子,文件的做成者,或者是安全性等级等。

「群组」,是用来把文件群加以分类的手段。群组,也可以包含多个 文件。在被分类为群组之后,控制部,于对象群组中所包含的全部文件都 判定为排除的时候,就可以称该项处理已经完成结束了。

「对象群组」,在上述的群组中,成为利用者所实施校阅的对象之群 组。显示部会由对象群组中,将所显示文件群予以抽出。通过显示控制部, 也可以对每个对象群组,控制其文件的显示顺序。还有,当控制部对于对 象群组内的全部文件都处理结束时,就可以选定下一个群组来当作对象文 件。

还有,本发明中的法庭用系统,还包括:

一群组比较部,前述对象群组所包含的各文件的特征量,和由前述利 用者判断其与诉讼是否有关联的判断结束之后的群组中所包含的文件的 特征量,将两者进行比较;

前述显示控制部,依据前述群组比较部的比较结果,来控制前述显示 部中,由前述对象群组所显示于利用者的文件群的显示顺序。

「群组比较部」,是一种在群组间,用来进行文件特征的比较处理的 手段。例如,群组比较部,由利用者判断与诉讼是否相关联的判断完成之 后的群组,把该群组中所包含的文件特征量当作比较对象,可以启发下一 个对象群组中所包含的各文件的识别信息的倾向。具体而言,群组比较部, 在由利用者完成是否与诉讼相关联的判断后的群组(在此称之为群组A) 之中,把对应于一个识别信息(在此称之为识别信息A)之高评分的文件 的共同的特征量加以抽出。群组比较部,则是进一步,把该被抽出的特征 量,和具有类似的特征量的文件,从下一个对象群组(在此作为群组B) 中进行检索,对应于特征量的类似程度,显示控制部会控制文件的排列顺 序。该排列顺序受到控制,位在上位的文件,就可以被认定为很有可能被 加上识别信息「HOT」的文件。因此,针对群组B,当利用者进行校阅时, 受到识别信息「HOT」容易被加上去的启发,可以达到提升校阅速度的目 的。

还有,本发明中的法庭用方法,是一种取得多个计算机或服务器中所 记录的数字信息,然后分析该取得的数字信息之法庭用方法,其系于计算 机中,执行:

把由前述数字信息中所包含的多个文件所构成的文件群,针对前述利 用者,予以显示的步骤;

由前述被显示的文件群中,对于前述利用者判断是否与诉讼相关联的 文件,也就是对象文件,根据前述利用者对其与诉讼是否相关联的判断, 加上一个识别信息,然后接收此识别信息的步骤;

把接收前述识别信息的对象文件的特征量,与前述文件群中的各文件 的特征量,两者做比较,根据比较的结果,对应于设定的识别信息,将前 述各文件的评分进行更新之步骤;和

根据前述更新被更新后的评分,将前述显示部所显示的前述文件群中 的文件的显示顺序,予以控制的步骤。

还有,本发明中的法庭用程序,是一种取得多个计算机或服务器中所 记录的数字信息,然后分析该取得的数字信息的法庭用程序,其是在计算 机中,执行:

把由前述数字信息中所包含的多个文件所构成的文件群,针对前述利 用者,予以显示的功能;

由前述被显示的文件群中,对于前述利用者判断是否与诉讼相关联的 文件,也就是对象文件,根据前述利用者对其与诉讼是否相关联的判断, 加上一个识别信息,然后接收此识别信息的功能;

把接收前述识别信息的对象文件的特征量,与前述文件群中的各文件 的特征量,两者做比较,根据比较的结果,对应于设定的识别信息,将前 述各文件的评分进行更新之功能;及

根据前述更新被更新后的评分,将前述显示部所显示的前述文件群中 的文件的显示顺序,予以控制的功能。

本发明的法庭用系统,法庭用方法,以及法庭用程序,具有:

针对其所显示的对象文件,把数字信息所包含的多个文件所组成的文 件群,对利用者加以显示的步骤;

由前述被显示的文件群中,对于前述利用者判断是否与诉讼相关联的 文件,也就是对象文件,根据前述利用者对其与诉讼是否相关联的判断, 加上一个识别信息,然后接收此识别信息的步骤;

把接收前述识别信息的对象文件的特征量,与前述文件群中的各文件 的特征量,两者做比较,根据比较的结果,对应于设定的识别信息,将前 述各文件的评分进行更新之步骤;和

根据前述更新被更新后的评分,将前述显示部所显示的前述文件群中 的文件的显示顺序,予以控制的步骤。

由此,利用者通过削减要进行关联性判断的文件数,来减轻利用者对 关联性判断的负荷,同时可以提升关联性判断的处理速度。

还有,本发明的法庭用系统,还包括一自动付与部,对于前述文件群 中的文件,根据前述更新后的评分,加上前述识别信息。此时,依据利用 者的判断结果,可以自动地对文件加上识别信息。

还有,本发明的法庭用系统的文件,具有逐一对应识别信息的评分, 该评分是,针对文件群中的各文件,由事先给定的初期评分开始,根据加 上识别信息的对象文件与各文件的特征量相比较的结果,利用加分或扣分 来加以算出,在被更新之际,如果利用者的判断有错误,即使加上了不适 当的识别信息,也可以依据对其他的文件的判断,使评分收敛在适当的值 中。

还有,本发明中的法庭用系统,还包括:一分类部,前述文件群根据 设定的要件,分类成群组,从前述群组当中,选择至少一个被当作处理对 象之对象群组;

前述显示控制部,由前述分类部所选择的对象群组当中,将显示于前 述利用者的文件群,予以抽出。此时,可以在类似度高的文件间,比较其 特征量。

还有,本发明中的法庭用系统,还包括:一群组比较部,前述对象群 组所包含的各文件的特征量,和由前述利用者判断其与诉讼是否有关联的 判断结束之后的群组中所包含的文件的特征量,将两者进行比较;

前述显示控制部,依据前述群组比较部的比较结果,来控制前述显示 部中,由前述对象群组所显示于利用者的文件群的显示顺序。此时,可以 启发利用者,事先在对象文件上加上可能性高的识别信息。

附图说明

图1是本发明的第1实施方式的处理以概念性显示的示意图。

图2显示本发明的第1实施方式中的处理流程图。

图3是本发明的第1实施方式相关的法庭用系统的功能方块图。

图4是本发明的第1实施方式中的显示部、显示控制部、识别信息接 收部、评分更新部、以及自动付与部显示其处理的流程图。

图5是本发明的实施方式中的分类部的处理的流程图。

图6是本发明的实施方式中的分类部的处理的模式图。

图7是本发明的实施方式中的群组比较部的处理的流程图。

图8是本发明的实施方式中的群组比较部的处理的模式图。

图9是本发明的第2实施方式中法庭用系统的功能方块图。

图10本发明的实施方式中的排除判定部的处理示意流程图。

图11是本发明的第2实施方式中显示部、显示控制部、识别信息接 收部、评分更新部、以及自动付与部的处理流程图。

附图符号说明

100   法庭用系统

101   数据库

210   显示部

310   显示控制部

410   识别信息接收部

510   评分更新部

610   排除判定部

710   控制部

810   自动付与部

910   分类部

920   群组比较部

具体实施方式

[第1实施方式]

以下,本发明的第1实施方式,用图1到图8来加以说明。

本发明的第1实施方式中的法庭用系统100,其是取得多个计算机或 服务器中所记录的数字信息,并分析该取得的数字信息的法庭用系统100, 包括:

一显示部210,由前述数字信息中包含的多个文件所组成的文件群中, 将至少一个以上的文件对利用者加以显示;

一识别信息接收部410,在前述文件群之中,针对前述利用者判断是 否为与诉讼相关联的文件,也就是对象文件,根据前述利用者判断是否与 诉讼相关联的结果,加上识别信息,该识别信息接收部用来接收前述识别 信息;

一评分更新部510,将接收到前述识别信息的对象文件的特征量,和 前述文件群中的文件的特征量作比较,根据比较结果,对应于设定的识别 信息,来更新前述文件群中的文件的评分;和

一显示控制部310,根据前述更新后的评分,来控制前述显示部210 所显示的前述文件群中的文件的显示顺序。

还有,在第1实施方式中,法庭用系统100,还包括一自动付与部810, 针对文件群中的文件,根据更新后的评分,来加上识别信息。

还有,在本实施方式中,法庭用系统100,还包括:一数据库101, 针对前述文件群中所包含的文件,将对应于前述识别信息的评分予以记 录,每当前述评分更新部510对评分进行更新时,将前述每个识别信息的 评分予以更新。在数据库101中,也可以将文件,加上去的识别信息,对 应于各识别信息的评分,以及超过界限值的信息等予以记录。

还有,法庭用系统100,还包括:一分类部910,前述文件群根据设 定的要件,分类成群组,从前述群组当中,选择至少一个被当作处理对象 之对象群组;

前述显示控制部,是由前述分类部所选择的对象群组当中,将显示于 前述利用者的文件群,予以抽出。显示部210,也可以从分类部910所选 择出来的对象群组中,将显示给利用者的文件,予以抽出。

法庭用系统100,还包括:一群组比较部920,把被包含在对象群组 中的各文件的特征量,与由利用者所校阅结束了的群组中所包含的各文件 的特征量,两者作一个比较。

显示控制部310,可以依照群组比较部920所做的比较的结果,来控 制由对象群组所显示的文件群的显示顺序。

在本实施方式中,在诉讼必要提出的文件上使用「HOT」这样的识别 信息,以进行与诉讼有关联性的判断为例,加以说明。该系统中或者是利 用者判断其是否与诉讼相关联的行为,称之为校阅。校阅,是把成为校阅 对象的文件(在此称之为对象文件),根据其与诉讼相关联的程度,或与 诉讼相关联的做法,分类成多个种类,对每个种类,逐一加上识别信息。

在图1中所示,是利用法庭用系统100来显示校阅的概念。当利用法 庭用系统100时,利用者把校阅(Human Review),参考法庭用系统100 所启发之校阅的预测结果(Automatic Predictive Coding)的同时,可加以 执行。具体的而言,利用者对某个文件进行校阅的话,法庭用系统100, 会把利用者所做的Human Review的校阅结果,与Human Review所执行 的进度,反映在校阅对象的文件上。

因此,当利用者对下一个文件进行校阅之际,在审视其由Automatic  Predictive Coding所启发的预测校阅结果的同时,也可以对该预测校阅结 果是否适切,以这样子的判断基准,来进行校阅。因此,当利用者对于通 过Automatic Predictive Coding所启发的预测校阅结果感到满足的时候, 就可以结束该校阅。由此,利用者通过削减要进行关联性判断的文件数, 来减轻利用者对关联性判断的负荷,同时可以提升关联性判断的处理速 度。

在此,使用图2,来概略说明第1实施方式整体性的处理流程。图2 是将第1实施方式整体性的处理流程,以概念式的显示的示意图。

法庭用系统100,在开始处理的时候,首先,先对文件的统整结果, 也就是文件群,进行分类成多个群组之分类处理(Clustering)(步骤1)。 然后,从分类后的群组中,把法庭用系统100中成为这次的处理对象r对 象群组加以选定。对象群组,是指在群组之中,成为利用者实施校阅的对 象的群组。

文件是指,包含有一个以上的单字的数据。文件的例子有:电子邮件, 简报数据,窗体计算数据,协商数据,契约书,组织结构,商业计划书等。 还有,文件有对应于逐个的识别信息的评分,该评分是,从针对文件群中 的各文件所事先加上的初期评分开始,把识别信息相关联的对象文件与各 文件的特征量相比较,根据该比较结果,将计算出来的值,利用加分或扣 分的方式予以计算,再加以更新。还有,文件群,是由多个文件所构成的。 群组,是将文件群予以分类后的分类文件。

当进行分类处理之际,可以把设定的要件作为分类的条件,来让利用 者加以输入。设定的要件也可以通过法庭用系统100来自动地加以输入。 具体而言,设定的要件可以是:文件所作成的年代,文件的扩张子,文件 的作成者,或者是安全性等级等。

接着,进行群组间的比较处理(Automatic Suggest Documents)(步 骤2)。在此,把与诉讼相关联的判断完成后的群组所包含的文件,来和 下一次的对象群组,作一个比较,则下一个对象群组中所包含的,某个文 件的特定的识别信息的倾向趋势,就可以得到启发。具体而言,在关联性 判断完成了的群组(作为群组A)当中,对应于一个识别信息(在此「HOT」) 的高评分的文件,抽出与其共同的特征量。该被抽出的特征量,与具有类 似的特征量的文件,由下一个对象群组(作为群组B)之中进行检索,对 应于特征量的类似度,来控制文件的排列顺序。最后,位于上位的文件, 会被认定是很有可能被加上识别信息「HOT」的文件。因此,针对群组B, 利用者进行校阅的时候,就可以受到启发,可以轻易地把识别信息「HOT」 加上去,也可以提高校阅的精度以及加快校阅的速度。

评分,文件和设定的识别信息相结合的程度,以定量性的评价后的结 果。例如,利用校阅,显示其与诉讼相关联性的「Responsive」,以及, 显示其与诉讼相关联非常强的重要的文件,使用到「HOT」来当标签为例, 加以说明。这时候,各文件,数据库上将「HOT」评分以及「Responsive」 评分予以记录的范围,也可以获得确保。然后,在上述2种的评分当中, 如果超过设定的界限值的话,可以加上超过界限值的识别信息。

特征量,是用来测定各文件间的类似度的手段。特征量,是使用文件 中频频出现的各单字的种类,各单字所具有的评价值,以及各单字的出现 次数,所组成的倾向信息,所计算出来的。

接着,利用者执行校阅(Human Review)(步骤3)。每当执行校阅 时,法庭用系统100,会使用该校阅的结果,算出各文件的评分(A  Automatic Real-Time Create Training Data)(步骤4)。接着,依照所计 算出来的评分的顺序,将对象群组内的文件进行排序,利用者在对下一次 的文件进行校阅之际,可以受到前次文件的校阅结果的启发(Suggest Next  Documents by Real-Time Automatic Predictive Coding)(步骤5)。法庭 用系统100,利用者从排序后的文件开始,到判断校阅的结束为止,对于 对象群组,反复进行从步骤3到步骤5的处理。在此,排序后的文件,由 于是以降序的顺序,来代表高的特定的识别信息,如果某个文件由利用者 看来,可以判断其确实与诉讼无关的话,那么位于这个文件之下的文件, 就可以被判断为全部都与诉讼无关了。因此,利用者就不必校阅所有的文 件,可以结束该关联性的判断。

图3是与第1实施方式相关的法庭用系统100的功能方块图。

在第1实施方式中,法庭用系统100,如图3所示,包括:显示部210、 显示控制部310、识别信息接收部410、评分更新部510、自动付与部810、 分类部910、群组比较部920,和数据库101。

法庭用系统100,为一计算机或服务器,根据各种的输入,由CPU 来执行记录在ROM里面的程序,在各种功能部进行运作。该程序,是储 存在CD-ROM等的记忆媒体中,或者是透过因特网等,来进行配置,也 可以直接安装在计算机中。还有,显示部210,例如是显示器,监视器, 平板计算机等具有显示功能的装置,由利用者操作,确认对象文件,进而 加上识别信息的装置。在第1实施方式中,法庭用系统100,虽然没有将 显示部210置于系统内,但是将其内含于系统的结构内亦无妨。

还有,法庭用系统100的各功能部以及显示部210,可以透过有线或 者是无线的网络来加以连接。也可以用云端计算的形态,来加以利用。

显示部210,是通过显示控制部310,把整列后的文件群的至少一个 以上的文件对利用者加以显示。

显示控制部310,是用来控制显示部210所显示的文件的顺序。在第 1实施方式中,显示控制部310会如文件所具有的评分所示的降序顺序, 对显示部210送出显示控制的指示。这个结果,利用者可以审视,其利用 显示控制部310,依照评分顺序来完成排序的文件,来判断有没有继续进 行校阅的必要。最后,校阅进行中的对象文件,如果很明显的与诉讼无关 的话,排在比当该对象文件更下位的文件,由于评分更低,所以就用不着 再校阅,可以判断这是与诉讼无关的。

识别信息接收部410,是接收由利用者经校阅所加到对象文件上的识 别信息。

识别信息是指,加在成为分类对象的文件上,使诉讼上的利用来得更 加容易,用来显示其与诉讼相关联的程度的手段。识别信息可以在各文件 上作为附带信息来加以记录,也可以把识别信息与文件之间的对应关系记 录在数据库101上。在识别信息中,举例而言,有显示其与诉讼相具有关 联性的「Responsive」,以及,显示其与诉讼相关联非常强的重要的文件, 使用到「HOT」来当标签,至于与这次诉讼无关的文件,也可以用 「Non-Responsive」等的关键词来表示。在第1实施方式中,加上作为识 别信息的「HOT」卷标,该卷标是,对应于文件,在数据库101上被加以 管理的。

评分更新部510是指,把识别信息接收部410所接收的识别信息的对 象文件的特征量,和文件群中所包含的文件的特征量,两者作一比较,来 更新对应于该接收的识别信息的评分的手段。评分更新部510也可以是, 例如,对应于特征量的一致度来对评分进行加分或扣分的手段。在第1实 施方式中,对于成为比较对象的文件,即使不包含对象文件本身,对象文 件仍可以作为更新对象的形态。例如,如果将对象文件本身包含于比较对 象中的话,由于特征量是完全一致的,所以相应的点可以对评分予以加分 后,进行更新。

文件,会根据一定的要件,而被给予初期评分。例如,可以根据文件 中所出现的单字,和各单字所具有的评价值,来算出初期评分。在第1实 施方式中,初期评分系根据设定的要件所计算出来的,对整体的文件,给 予一定值。从初期评分开始,经过进行加分或扣分的处理,来更新评分。

自动付与部810,是对各文件将适当的识别信息予以评分,自动地加 以判断,加在此评分上的手段。也可以是对识别信息的每个种类,设置界 限值,对超过该界限值的文件,加上识别信息的手段。在第1实施方式中, 具有「HOT」评分的界限值α。最后,自动付与部810,依评分更新部510 针对各文件的「HOT」评分,进行更新处理后的结果,把超过α以上的文 件,加上识别信息为「HOT」的卷标。

群组比较部920是指,在群组间进行文件的特征的比较处理之手段。 使用利用者所校阅完成的群组中所包含的文件的特征量,作为比较对象, 可以启发对下一个对象群组所包含的文件的特定的识别信息的倾向趋势。 具体而言,由利用者所校阅完成的群组(作为群组A)中,把对应于一个 识别信息(在此为「HOT」)为高评分的文件,其共同的特征量予以抽出。 把该被抽出的特征量,和具有类似的特征量的文件,从下一个对象群组(作 为群组B)中进行检索,对应于特征量的类似程度,由显示控制部310来 控制文件的排列顺序。在控制该排列顺序后,来到上位的文件,就被认定 是很有可能被加上识别信息「HOT」的文件。因此,针对群组B,利用者 进行校阅的时候,就可以受到启发,而轻易地加上识别信息「HOT」,也 可以提高校阅的精度以及校阅的速度。

参照图4,说明显示部210,显示控制部310,识别信息接收部410, 评分更新部510,自动付与部810的处理流程。图4系显示本实施方式中, 显示部210,显示控制部310,识别信息接收部410,评分更新部510,自 动付与部810的处理流程图。

显示部210,是由文件群中,显示出校阅对象的文件也就是文件1(步 骤11)。利用者对文件1进行校阅,然后加上「HOT」的卷标,该「HOT」 卷标则由识别信息接收部410来加以接收(步骤12)。

评分更新部510,针对「HOT」的标签,为了更新各文件的评分,将 文件1与其他的文件的特征量作一比较(步骤13)。还有,在第1实施 方式中,在评分更新部510,利用者对进行校阅后的文件,不得进行评分 的更新处理。

评分更新部510,会根据比较的结果,对于其他的文件中有「HOT」 标签的评分,进行加分或扣分的处理(步骤14)。

评分更新后,自动付与部810,进行被更新后的评分的值是否超过α 之检定(步骤15)。如果有评分超过α的文件的话(步骤15:YES), 对于当该文件,自动付与部810就会将它加上「HOT」标签(步骤16)。 至于对于评分没有超过α的文件(步骤15:NO),就不加上标签。

自动付与处理后,显示控制部310,会把更新后的评分依照降序排列 的顺序,对文件进行排序的控制(步骤17)。如果利用者判断为结束的 话(步骤18:YES),就在这里结束处理。如果利用者判断其尚未结束的 话(步骤18:NO),显示部210会对显示控制部310所排序后的文件, 从上面的位置开始,依顺序加以显示(步骤19)。这时候,利用者会再 度对来到最上位的文件,加上标签(步骤12:第2回)。以下,利用者 在判定其为结束之前,将步骤12到步骤19的处理,重复循环进行。

图5系显示分类部910的处理的流程图。在分类部910中,接收利用 者所输入的要件(步骤111)。其后,根据所输入的设定要件,执行分类 处理(步骤112)。图6是将分类处理的执行结果,以模式性的显示之示 意图。

图6的上段,是显示文件群中的文件。利用者把作为分类的要件,例 如「年代」,进行输入的话,文件群中的文件,会如图6的后段所示,依 照年代别来进行群组分类。

图7,是显示群组比较部920的处理流程之示意图。

在群组比较部920中,把校阅处理完成后的群组(作为群组A),和 成为下一个校阅对象的群组(作为群组B)之间进行比较(步骤121)。 具体而言,群组A所包含的文件(作为文件1)的特征量,和群组B所包 含的文件(作为文件2)的特征量,两者进行比较。例如,如果文件2的 特征量与文件1的特征量相类似的话,根据文件1的各识别信息的评分以 及类似程度,对文件2的各识别信息给予一个暂时性的评分(步骤122)。

所谓暂时性的评分,是指为了让群组比较部920进行比较处理,而对 各文件暂时性地加上去的评分。因此,不使用自动付与部810的识别信息 的付与处理。在第1实施方式中,群组比较部920,虽然会使用暂时性的 评分来进行处理,但是将通常的评分直接更新后进行处理亦无妨。

群组处理部,是由各识别信息所加上去的暂时性的评分,依照降序顺 序,来排列文件(步骤123)。

图8是显示群组比较部920以及显示控制部310的处理之模式图。将 校阅实施完毕的群组A的处理结果,反映在群组B上(图8上段),显 示控制部310针对群组B中所包含的文件加上各识别信息,将暂时性的 评分依照降序顺序来加以排列(图8下段)。由此,利用者就可以轻易地 从加上「HOT」标签的文件中,依序进行校阅。

[第2实施方式]

以下,将本发明的实施方式,用图9到图11来加以说明。

本发明的第2实施方式中的法庭用系统100,是取得多个计算机或服 务器中所记录的数字信息,并分析该取得的数字信息的法庭用系统100, 包括:

一显示部210,由前述数字信息中包含的多个文件所组成的文件群中, 将至少一个以上的文件对利用者加以显示;

一识别信息接收部410,在前述文件群之中,针对前述利用者判断是 否为与诉讼相关联的文件,也就是对象文件,根据前述利用者判断是否与 诉讼相关联的结果,加上识别信息,该识别信息接收部用来接收前述识别 信息;

一评分更新部510,将接收到前述识别信息的对象文件的特征量,和 前述文件群中的文件的特征量作比较,根据比较结果,对应于设定的识别 信息,来更新前述文件群中的文件的评分;和

一显示控制部310,根据前述更新后的评分,来控制前述显示部210 所显示的前述文件群中的文件的显示顺序。

还有,第2实施方式中的法庭用系统100,还包括一自动付与部810, 对于前述文件群中的文件,根据前述更新后的评分,加上前述识别信息。

还有,第2实施方式中的法庭用系统100,还包括:一数据库101, 针对前述文件群中所包含的文件,将对应于前述识别信息的评分予以记 录,每当前述评分更新部510对评分进行更新时,将前述每个识别信息的 评分予以更新。数据库101中,也可以用来记录:文件,被加上去的识别 信息,对应于各识别信息的评分,以及超过界限值的信息等。

还有,第2实施方式中的法庭用系统100,还包括:

一排除判定部610,将前述评分达到特定的值的文件,利用前述显示 部210,把从被显示出来的文件的候补中,判定其予以排除;和

一控制部710,在前述被判定文件的数量还没有超过设定的值之前, 将前述显示部210,前述识别信息接收部410,前述评分更新部510,前 述显示控制部310,和前述排除判定部610的处理,控制为可反复执行。

图9,是在第2实施方式中的法庭用系统100之功能方块图。

在第2实施方式中,法庭用系统100系,如图9所示,包括:显示部 210,显示控制部310,识别信息接收部410,评分更新部510,排除判定 部610,自动付与部810,控制部710,分类部910,群组比较部920,和 数据库101。

本实施方式中的校阅处理,使用「HOT」卷标来当作识别信息,进行 判断与诉讼的关联性的处理。

排除判定部610,当评分更新之际,把更新后的评分达到特定值的文 件,由显示部210所显示的对象文件的候补中,判定其予以排除之手段。 排除判定部610,作为排除判定的前段,对每个识别信息进行结束判定, 对其所有的识别信息都被判定为结束的文件,进行排除判定。在本实施方 式中,作为特定值,有β1和β2两个界限值(β1>β2)。排除判定部 610,当评分透过加分而超过β1时,或者是透过扣分而低于β2时,进行 该识别信息的结束判定。在第1实施方式中,可以加上3种识别信息。这 时候,排除判定部610,会对所有具3种识别信息而被判定为排除的文件, 从对象文件的候补中,予以排除。

还有,对一个识别信息的评分达到β1或β2,被判定为结束判定的 时候,对于该超过限定值的识别信息,可以在该当文件上,加上其已被排 除的意旨之显示。

使用图10,说明关于排除判定部610的处理。图10,是利用者在校 阅过程中,对文件1加上识别信息为「HOT」卷标时,排除判定部610 的处理流程。利用者在校阅过程中,由于加上识别信息为「HOT」卷标来 进行处理,所以即使是排除判定部610,也会针对「HOT」标签,来进行 各文件的排除判定。

在排除判定部610中,检定各文件的「HOT」评分的值(步骤621)。 在此,α是自动付与部810进行加上识别信息的处理之判断基准的界限 值。评分,对于比β2大而比α小的文件,在排除判定部610中,不进行 任何的处理(步骤622)。另一方面,对于评分在β1以上或β2以下的 文件,会加上「HOT」标签,来进行结束判定(步骤623)。这时候,也 对其他的识别信息的评分进行判定(步骤624),当全部都是β1以上或 β2以下时(步骤624:YES),则将该文件从校阅对象中,予以排除(步 骤625)。对于只有一个是比β1小且比β2大的评分识别信息的文件(步 骤624:NO),则不进行排除判定,就此结束。

控制部710,可将显示部210,识别信息接收部410,评分更新部510, 显示控制部310,和排除判定部610的处理,控制为可反复执行。该控制, 也可以是从一开始就对每个处理,循环地反复地进行的手段。还有,控制 部,也可以用批次性地处理一定数量之后,再执行后段的处理,以逐单位 地反复进行。在第2实施方式中,显示控制部310,在将后述的群组中所 包含的全部文件都判定而加以排除时,就是完成了控制处理。

图11是本实施方式中的整体处理的概要的之流程图。在此,以利用 者对文件1进行校阅,并加上「HOT」标签为例,进行说明。

首先,将文件1显示于显示部210的画面上(步骤130)。对由显示 部210所显示的文件1,利用者将其加上识别信息为「HOT」的卷标(步 骤131),该「HOT」标签,会由识别信息接收部410,将其作为利用者 加在文件1上的识别信息,来加以接收。

评分更新部510,针对「HOT」标签,为了更新各文件的评分,把文 件1和其他的文件(在此作为文件2)的特征量进行比较(步骤132)。 还有,在第2实施方式中,在评分更新部510,利用者对进行校阅后的文 件,无法进行评分的更新处理。因此,文件1在利用者结束校阅的时间点, 就已结束判定。

评分更新部510,根据比较的结果,针对文件2中的「HOT」的标签 的评分,进行加分或扣分的处理(步骤133)。

评分更新后,排除判定部610,会对文件2中「HOT」评分的值进行 检定(步骤134)。排除判定部610,对于文件2的「HOT」评分,如果 是大于β1且小于α的话,就不进行处理(步骤135)。另一方面,如果 是大于α且小于β1的话,就对文件2加上「HOT」的标签(步骤136)。

如果文件2的评分大于β1的话,排除判定部610会针对「HOT」, 进行结束判定(步骤137)。这时候,如果对文件2不加上「HOT」标签 的话,自动付与部810就会执行加上识别子的处理。

还有,当文件2的评分在β2以下时,排除判定部610,会针对「HOT」 进行结束判定(步骤138)。当执行步骤137以及步骤138的处理时,排 除判定部610,会对文件2的其他识别信息的评分是否达到β1或β2に 进行检定(步骤139)。检定的结果,如果达到β1或β2的话(步骤139: YES),就将文件2从显示部210的显示候补中排除(步骤140)。在步 骤141的处理完成之后,控制部710会对全部的文件是否被排除判定,进 行检定(步骤141),如果确定为是(步骤141:YES),则结束处理。

当步骤135或者是步骤136的处理完成之后,或者是步骤139中的评 分被判断为小于β1且大于β2判断的话(步骤139:NO),则移到控制 部710进行下一个处理。此时,对于还没有完成排除判定的文件,通过显 示控制部310,把被更新后的评分的值,依照升幂顺序,进行排序(步骤 143)。

利用控制部310来重新排列,将排列顺序的结果,依评分高的顺序, 通过显示部210来加以显示(步骤144)。

至于其他的构成,功能,则是与第1实施方式相同。

法庭用系统100,包括:

一显示部210,由前述数字信息中包含的多个文件所组成的文件群中, 将至少一个以上的文件对利用者加以显示;

一识别信息接收部410,在前述文件群之中,针对前述利用者判断是 否为与诉讼相关联的文件,也就是对象文件,根据前述利用者判断是否与 诉讼相关联的结果,加上识别信息,该识别信息接收部用来接收前述识别 信息;

一评分更新部510,将接收到前述识别信息的对象文件的特征量,和 前述文件群中的文件的特征量作比较,根据比较结果,对应于设定的识别 信息,来更新前述文件群中的文件的评分;和

一显示控制部710,根据前述更新后的评分,来控制前述显示部210 所显示的前述文件群中的文件的显示顺序。

由此,利用者通过削减要进行关联性判断的文件数,来减轻利用者对 关联性判断的负荷,同时可以提升关联性判断的处理速度。

还有,法庭用系统100,还包括一自动付与部810,针对文件群中的 文件,根据被更新后的评分,加上识别信息。此时,依据利用者的判断结 果,可以自动地对文件加上识别信息。

还有,法庭用系统100的文件,具有逐一对应识别信息的评分,该评 分是,针对文件群中的各文件,由事先给定的初期评分开始,根据加上识 别信息的对象文件与各文件的特征量相比较的结果,利用加分或扣分来加 以算出,在被更新之际,如果利用者的判断有错误,即使加上了不适当的 识别信息,也可以依据对其他的文件的判断,使评分收敛在适当的值中。

还有,法庭用系统100,还包括一分类部910,根据将文件群设定的 要件,将群组加以分类,由该群组中,把成为处理对象的对象群组,选择 其中至少一个.利用显示部210,由分类部910所选择的对象群组中,在将 显示给利用者的文件群中予以抽出之际,在其中类似度高的文件间,可以 比较其特征量。

还有,法庭用系统100,还包括:一群组比较部920,将前述对象群 组所包含的各文件的特征量,和由控制部710所控制处理结束后的群组中 所包含的特征量,两者进行比较;

前述显示控制部310,依据显示于前述显示部210中,前述群组比较 部920的比较结果,来控制由前述对象群组所显示于文件群的显示顺序之 际,可以暗示利用者事先在对象文件上加上可能性高的识别信息。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号