首页> 中国专利> 提取重要关键字的方法和执行所述方法的服务器

提取重要关键字的方法和执行所述方法的服务器

摘要

一种通过重要关键字提取服务器来提取重要关键字的方法,所述方法包括:从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字;通过服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过服务器基于一个或更多个用户定义关键字来确定用于每个字的权重;通过服务器来将用于每个字的权重应用于每个字的相对重要性值;通过服务器基于应用了权重的相对重要性值来将至少一个字确定为重要关键字;以及通过服务器来将重要关键字传送至用户终端。因此,所述方法可以从至少一个文件中有效地检测用户定义关键字。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-04-05

    授权

    授权

  • 2015-06-17

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20141107

    实质审查的生效

  • 2015-05-20

    公开

    公开

说明书

相关申请的交叉引用

本申请要求2013年11月11日提交的申请号为10-2013-0136564的韩国专利申请的 较早申请日的权益以及优先权,该申请的全部内容通过引用合并于此。

技术领域

本公开的实施例涉及提取重要关键字的计算机可执行技术,且更具体而言,涉及从 一个或更多个文件中提取重要关键字的方法和执行所述方法的服务器。

背景技术

关键字分析使用模式匹配技术来分析句子的内容。在关键字分析过程中,可以基于 分析器的主观经验来确定关键字,然后在目标文件的搜索中将其与搜索关键字相匹配。

由于相关技术中的关键字分析使用由分析器主观选择的字作为重要的字,这种关键 字分析可能未使用在目标文件中实际重要的关键字。

发明内容

本公开的实施例针对一种基于用户定义关键字从至少一个文件中有效地提取重要 关键字的方法。

本公开的实施例针对一种通过确定在至少一个文件中检测出的字的相对重要性并 将用户定义关键字的权重应用于所述字的相对重要性来提取重要关键字的方法。

本公开的实施例针对一种提取重要关键字并将具有包括重要关键字的至少一个关 键字列表提供给用户的方法。

在一些实施例中,一种通过重要关键字提取服务器来提取重要关键字的方法包括: 从网络接收一组的一个或更多个文件;从用户终端接收一个或更多个用户定义关键字; 通过服务器来计算在所述一组文件中检测出的每个字的相对重要性值;通过服务器基于 一个或更多个用户定义关键字来确定用于每个字的权重;通过服务器来将用于每个字的 权重应用于每个字的相对重要性值;通过服务器基于应用了权重的相对重要性值来将至 少一个字确定为重要关键字;以及通过服务器来将重要关键字传送至用户终端。

在一个实施例中,计算相对重要性值可以包括:通过对特定的字在一个或更多个特 定文件中出现的次数和包含所述一个或更多个特定文件的一个或更多个文件中所包括的 全部的字的数目执行算术运算,来确定在所述一个或更多个特定文件中检测出的特定的 字的初始重要性值。

计算相对重要性值还可以包括:确定包含特定的字的一个或更多个特定文件的数目 与一个或更多个文件的总数目的比,其中,通过对特定的字的初始重要性值和所述比执 行算术运算来计算相对重要性值。

确定用于每个字的权重还可以包括:将来自用户终端的一个或更多个用户定义关键 字和用于所述一个或更多个用户定义关键字的相应权重储存在数据库中;在所述一组文 件中搜索与至少一个用户定义关键字相匹配的至少一个字;搜索用于与所述至少一个字 相匹配的至少一个用户定义关键字的相应权重;以及基于用于所述至少一个用户定义关 键字的相应权重来确定用于每个字的权重。

在一个实施例中,搜索所述至少一个字可以包括:基于在所述一组文件中检测出的 字的缩写来搜索所述至少一个字。

在一个实施例中,所述方法还可以包括:在所述一个或更多个文件中分析字的词素 (morpheme),并且基于词素分析的结果来检测包括名词的字。在本文中,名词可以包 括普通名词、专有名词和复合名词。

在一个实施例中,所述一个或更多个用户定义关键字可以包括由多个关键字组成的 一组关键字。

在一个实施例中,所述方法还可以包括:从用户终端接收用于所述一个或更多个用 户定义关键字的权重,以及将所述一个或更多个用户定义关键字和用于所述一个或更多 个用户定义关键字的权重储存在数据库中。

在一个实施例中,所述方法还可以包括:计算所述一个或更多个用户定义关键字的 相对重要性值;基于所述一个或更多个用户定义关键字的计算出的相对重要性值来确定 用于所述一个或更多个用户定义关键字的权重;以及将所述一个或更多个用户定义关键 字和用于所述一个或更多个用户定义关键字的权重储存在数据库中。

在一个实施例中,所述方法还可以包括:从所述一组文件中所检测出的字中检测与 所述一个或更多个用户定义关键字相似的字,以及将所述相似的字储存在存储器中。

将所述至少一个字确定为重要关键字还可以包括:将具有等于或高于预定值的加权 相对重要性值的至少一个字确定为重要关键字。

所述方法还可以包括从用户终端接收包括与用户所请求的关键字的数目有关的信 息的请求,其中,传送重要关键字包括将与关键字的数目相对应的重要关键字传送至用 户终端。

在一些实施例中,一种系统包括处理器、非暂存性计算机可读媒介,所述非暂存性 计算机可读媒介在其上储存有指令,当执行所述指令时,使处理器执行如下方法,所述 方法包括:计算在一个或更多个文件中检测出的每个字的相对重要性值;将每个字与一 个或更多个用户定义关键字进行比较;如果至少一个字与至少一个用户定义关键字相匹 配,则将用于所述至少一个用户定义关键字的权重应用于所述至少一个字的相对重要性 值;将具有高重要性值的至少一个字确定为重要关键字;以及将重要关键字传送至用户 终端。

在一个实施例中,计算相对重要性值可以包括:通过对特定的字在一个或更多个特 定文件中出现的次数和包含所述一个或更多个特定文件的一个或更多个文件中所包括的 全部的字的数目执行算术运算,来确定在所述一个或更多个特定文件中检测出的所述特 定的字的初始重要性值;确定所述一个或更多个特定文件的数目与所述一个或更多个文 件的数目的比;以及通过对所述特定的字的初始重要性值和所述比执行算术运算来计算 每个字的相对重要性值。

在一个实施例中,所述方法还可以包括:分析一个或更多个文件中所包括的字的词 素,以及基于词素分析的结果来检测包含名词的字。

比较每个字还可以包括:确定在所述一个或更多个文件中检测出的字中哪些字具有 高相对重要性值,以及将具有高相对重要性值的字与所述一个或更多个用户定义关键字 进行比较。

在一个实施例中,所述方法还可以包括从用户终端接收包括与用户所请求的关键字 的数目有关的信息的请求,其中,传送重要关键字包括将与关键字的数目相对应的重要 关键字传送至用户终端。

在一些实施例中,一种非暂存性计算机可读媒介,所述非暂存性计算机可读媒介在 其上储存有计算机可执行指令,当处理器执行所述指令时,执行如下方法,所述方法包 括:计算在一个或更多个文件中检测出的每个字的相对重要性值;将每个字与一个或更 多个用户定义关键字进行比较,以及如果至少一个字与至少一个用户定义关键字相匹配, 则将用于所述至少一个用户定义关键字的权重应用于所述至少一个字的相对重要性值, 以确定所述至少一个字的重要性值;将具有高重要性值的至少一个字确定为重要关键字; 以及将重要关键字传送至用户终端。

在一个实施例中,计算相对重要性值可以包括:通过对特定的字在一个或更多个特 定文件中出现的次数和包含所述一个或更多个特定文件的一个或更多个文件中所包括的 全部的字的数目执行算术操作,来确定在所述一个或更多个特定文件中检测出的特定的 字的初始重要性值;确定所述一个或更多个特定文件的数目与所述一个或更多个文件的 数目的比;以及通过对所述特定的字的初始重要性值和所述比执行算术运算,来计算每 个字的相对重要性值。

本公开的实施例可以在至少一个文件中有效地检测重要关键字。

本公开的实施例可以确定在至少一个文件中检测出的字的相对重要性,以及将用户 定义关键字的权重应用于检测出的字的相对重要性以找到重要关键字。

本公开的实施例可以提供至少一个关键字列表,所述至少一个关键字列表包括基于 在至少一个文件中检测出的字的重要性而确定出的重要关键字。

附图说明

图1是说明根据本公开的一个实施例的重要关键字提取系统的框图。

图2是说明根据本公开的一个实施例的重要关键字提取服务器的框图。

图3是说明根据本公开的一个实施例的重要关键字提取过程的流程图。

图4说明用于用户定义关键字的权重。

图5A和图5B说明词素的相对重要性。

图6说明所计算出的词素的重要性。

图7A至图7C说明关键字列表。

图8说明根据本公开的一个实施例的重要关键字提取服务器的简化视图。

具体实施方式

实施例的说明提供了对各种特征的结构或功能的解释,所以本公开的范围不应当被 解释为局限于本文中所述的实施例。即,由于在不脱离实施例的特点的情况下可以用若 干形式来实施实施例,所以应当理解的是,描述的实施例不受在前描述的任何细节所限, 除非另外说明,而应该在所附权利要求中限定的范围内广义地解释。因此,落入权利要 求范围内的各种变化和修改或该范围的等同形式旨在包含在所附权利要求中。

在本公开中描述的术语可以被理解如下。在本公开中的单数形式(例如,“一个”) 旨在也包括复数形式,除非上下文另有明确指示。还将理解的是,诸如“包括”或“具 有”等的术语旨在表示在说明书中公开的特征、数目、操作、动作、部件、部分或其组 合的存在,并非旨在排除可存在或可增加一个或更多个其他特征、数目、操作、动作、 部件、部分或其组合的可能性。

相应步骤或操作中的标识字母(例如,a、b、c等)是用于解释的目的,并非旨在 将实施例限制于任何特定的顺序。相应操作的顺序可以从描述的顺序改变,除非上下文 明确地指出特定顺序。

在本公开中使用的术语仅用于描述特定的实施例,并非旨在进行限制。除非另有限 定,否则本文中使用的所有术语,包括技术或科学术语,都具有与本公开所属技术领域 的普通技术人员通常理解的相同含义。如在通用词典中定义的这些术语要被解释成具有 与相关技术领域中的语境含义相符的含义,而不被解释成具有不切实际或过分形式的含 义,除非在本申请中清楚地指出。

图1是说明根据本公开的一个实施例的重要关键字提取系统的框图。

参见图1,重要关键字提取系统100包括:重要关键字提取服务器110和用户终端 120。

重要关键字提取服务器110可以经由在线网络130从用户终端120接收由用户定义 的一个或更多个关键字,即用户定义关键字。在本文中,重要关键字提取服务器110可 以被实施为多个分布式计算设备或单个计算设备。用户定义关键字可以包括用户输入用 以确定哪些字重要的搜索项目。

重要关键字提取服务器110可以在一个或更多个文件中检测字并且确定每个字的重 要性,以及可以根据每个检测出的字的重要性来将一个或更多个检测出的字提供至用户 终端120。

用户终端120可以经由网络130与重要关键字提取服务器110连接并且与重要关键 字提取服务器110通信。用户终端120可以是包括CPU(中央处理单元)、存储设备和 输入/输出设备的计算设备,诸如PC(个人计算机)、智能手机、PDA(个人数字助理) 或者平板PC。为了便于说明,图1示出单个用户终端。然而,在一些实施例中,多于一 个的用户终端可以与一个重要关键字提取服务器110通信。

用户终端120可以从重要关键字提取服务器110接收具有高相对重要性的至少一个 字。用户终端120可以将经由输入设备从用户接收的用户的输入提供至重要关键字提取 服务器110,以及可以经由输出设备将其响应输出至用户。

图2是说明根据本公开的一个实施例的重要关键字提取服务器110A的框图。

参见图2,重要关键字提取服务器110A包括:相对重要性计算器210、字重要性确 定器220、关键字提供器230、字提取器240以及控制器250。

相对重要性计算器210计算在一个或更多个文件中检测出的每个字的相对重要性。

相对重要性计算器210可以经由用户终端120和网络130从用户接收与一个或更多 个文件有关的信息。在一个实施例中,所述文件可以对应于在因特网或者其他网络(诸 如网页、博客、主页、推特(Twitter)订阅、或者包括广告和与产品有关的信息的其他 社交媒体网站等)上可搜索到的记录。本申请可以应用于在数据库中储存的文件。

相对重要性计算器210可以通过对特定的字在特定文件中出现的次数和包含所述一 个或更多个特定文件的全部文件中所包括的全部的字的数目执行算术运算,来确定在所 述一个或更多个特定文件中检测出的特定的字的初始重要性。例如,可以通过将特定的 字在特定文件中出现的次数除以全部文件中所包括的字的总数目所获得的值,来确定在 特定文件中检测出的特定的字的初始重要性。因而,在一个实施例中,假设有一组文件, 任何给定的字可能仅在特定文件中出现,而不在其他文件中出现。所述字的初始重要性 对应于通过将所述字在特定文件中出现的次数除以整组文件(包含不包括所述字的文件) 中的字的总数目所获得的值。之后,相对重要性计算器210可以通过对包括特定的字的 特定文件的数目和文件的总数目执行算术运算,来确定包括特定的字的特定文件的数目 与文件的总数目的比。包括特定的字的特定文件与文件的总数目的比可以对应于通过将 特定文件的数目除以文件的总数目所获得的值。

相对重要性计算器210可以通过对与特定的字的初始重要性相对应的值和包括特定 的字的特定文件与文件的总数目的比执行算术运算,来计算特定的字的相对重要性。特 定的字的相对重要性对应于通过将表示特定的字的初始重要性的值除以与包括特定的字 的特定文件的比相对应的值所获得的值。

字重要性确定器220将在一个或更多个文件中检测出的每个字与用户定义关键字进 行比较,并且将用于至少一个用户定义关键字的权重应用于至少一个字,来确定字的加 权重要性。

字重要性确定器220可以从在一个或更多个文件中检测出的字中检测与至少一个用 户定义关键字相似的字,并且将所述相似的字暂时地储存在存储器中。在一个实施例中, 存储器储存在一个或更多个文件中检测出的至少一个相似的字,并且在经过特定时间之 后删除所述相似的字。在另一个实施例中,存储器储存在一个或更多个文件中检测出的 至少一个相似的字,并且在接收到另一组的一个或更多个文件时删除储存在存储器中的 所有相似的字。

字重要性确定器220可以基于在一个或更多个文件中检测出的字的缩写来搜索关键 字数据库,以将每个字与储存在关键字数据库中的用户定义关键字进行比较。字重要性 确定器220可以基于字的缩写来搜索关键字数据库以减少搜索时间。然而,实施例不局 限于此。例如,如果字是韩语,则字重要性确定器220可以基于字的辅音来搜索关键字 数据库。

在一个实施例中,如果在关键字数据库中没有与在一个或更多个文件中检测出的特 定的字相对应的用户定义关键字,则字重要性确定器220可以确定出通过相对重要性计 算器210计算出的特定的字的相对重要性是所述特定的字的加权重要性。

如果在关键字数据库中找到与特定的字相对应的用户定义关键字,则字重要性确定 器220可以将用于用户定义关键字的权重分配给所述特定的字。在本文中,权重可以被 实现为小数。

在一个实施例中,字重要性确定器220可以从用户接收用户定义关键字和用于用户 定义关键字的权重,并且按字母顺序将用户定义关键字分类。分类的用户定义关键字和 用于用户定义关键字的权重储存在关键字数据库中。

在另一个实施例中,如果仅从用户接收用户定义关键字而不接收其权重,则字重要 性确定器220可以分析用户定义关键字的相对重要性以确定用于所述用户定义关键字的 权重,然后可以按字母顺序来将用户定义关键字分类,以及将用户定义关键字和用于所 述用户定义关键字的权重储存在关键字数据库中。

字重要性确定器220可以设定用于用户定义关键字的权重范围,并且测量用于用户 定义关键字的权重是否在所述权重范围内。如果用于用户定义关键字的权重不在所述权 重范围内,则字重要性确定器220可以将用户定义关键字的权重调整在所述权重范围内。

在一个实施例中,用户定义关键字可以是由一个关键字组成的单个关键字、或者是 由多个关键字组成的一组关键字。例如,单个关键字可以包括单个字,例如,PATENT、 JAVA、EVENT或KEYWORD,而一组关键字可以包括至少两个字,例如,CLASSIC  MUSIC、TEST SCHEDULE或SONG LYRICS。

关键字提供器230为用户提供根据字的加权重要性从在一个或更多个文件中检测出 的字中选择的一个或更多个关键字。关键字提供器230可以将包括根据字的加权重要性 而确定的一个或更多个关键字的关键字列表提供给用户。在本文中,关键字提供器230 可以根据关键字的加权重要性来将一个或更多个关键字分类,并且提供包括分类的关键 字的关键字列表作为重要关键字。

关键字提供器230可以从用户接收包括与用户所请求的关键字的数目有关的信息的 请求,以及将与用户所请求的关键字的数目相对应的重要关键字提供至用户作为对用户 请求的响应。

字提取器240可以分析一个或更多个文件中所包括的字的词素,并且基于词素分析 结果来提取包含名词的字。在本文中,名词可以包括普通名词、专有名词和复合名词中 的至少一种。

在一个实施例中,字提取器240可以利用词素分析器来分析一个或更多个文件中所 包括的字的词素。例如,字提取器240可以基于词法词素和语法词素来分析字的词素。 词法词素对应于词典中所列出的单独定义的词素。例如,在“my mother just hates me” 中,其词法词素可以被分析为[mother]、[hate]、[just]和[i]。语法词素帮助对特定的字给 出含义、对特定的字分配格(诸如主格或宾格)、将特定的字放在修饰名词短语的位置、 将动词或形容词变成名词、或者表达过去时态。例如,在“my mother just hates me”中, 其语法词素可以被分析为[my]、[-s]和[me]。

字提取器240可以将从一个或更多个文件中提取的字储存在数据库中。可以储存每 个提取出的字以关联于与提取出每个字的相应文件有关的信息。数据库可以与关键字数 据库在物理上分离或结合。

控制器250可以控制重要关键字提取服务器110A的全部操作。具体地,控制器250 可以控制相对重要性计算器210、字重要性确定器220、关键字提供器230和字提取器 240之间的信号(例如,命令)流动和/或数据流动。

图3是说明根据一个实施例的重要关键字提取过程的流程图。将参照图2中所示的 重要关键字提取服务器110A来描述所述重要关键字提取过程。

参见图3,字提取器240分析在一个或更多个文件中包括的字的词素,并且基于词 素分析的结果来提取包括名词的字(S301和S302)。

相对重要性计算器210计算在所述一个或更多个文件中检测出的每个字的相对重要 性(S303)。

在一个实施例中,相对重要性计算器210可以通过对特定的字在一个或更多个特定 文件中出现的次数和全部文件中所包括的字的总数目执行算术运算,来确定在所述一个 或更多个文件的所述一个或更多个特定文件中检测出的特定的字的初始重要性。例如, 当[PATENT]在文件1中出现的次数为5且全部的一个或更多个文件中所包括的字的总数 目为5125,则在文件1中检测出的[PATENT]的初始重要性可以被确定为大约0.0009756 (5/5125)。

相对重要性计算器210可以通过对所述一个或更多个特定文件的数目和所述一个或 更多个文件的总数目执行算术运算,来确定包括特定的字的所述一个或更多个特定文件 与所述一个或更多个文件的总数目的比。例如,当包括[PATENT]的特定文件的数目为4 并且文件的总数目为10时,包括[PATENT]的特定文件与文件的总数目的比可以被确定 为0.25(4/10)。

相对重要性计算器210可以通过对与特定的字的初始重要性相对应的值和包括所述 特定的字的特定文件的比执行算术操作,来计算在所述一个或更多个文件中检测出的每 个字的相对重要性。例如,当与在特定文件中检测出的[PATENT]的初始重要性相对应的 值大约为0.0009756,并且包括[PATENT]的特定文件与文件的总数目的比为0.25时, [PATENT]的相对重要性可以被确定为0.003902(0.0009756/0.25)。

图5A说明在每个文件(例如,文件1至文件10)中检测出的[PATENT]、 [KEYWORD]、[EVENT]、[MEASUREMENT]、[KOREA]、[JAVA]、[BANK]和[SEOUL] 中的每个的相对重要性,图5B说明在全部文件(例如,文件1至文件10)中检测出的 [PATENT]、[KEYWORD]、[EVENT]、[MEASUREMENT]、[KOREA]、[JAVA]、[BANK] 和[SEOUL]中的每个的相对重要性。相对重要性计算器210可以通过沿着图5A中的方 向b而对在文件1至文件10的每个中的[PATENT]的相对重要性的值求和,来计算在所 述一组的一个或更多个文件中的[PATENT]的相对重要性。相对重要性计算器210可以通 过沿着图5A中的方向b而对在文件1至文件10的每个中的[KEYWORD]的相对重要性 的值求和,来计算在所述一组的一个或更多个文件中的[KEYWORD]的相对重要性。相 对重要性计算器210可以继续计算关键字相对于全部的一个或更多个文件的相对重要 性,直到计算出最后一个关键字(在本实例中,为[SEOUL])的相对重要性为止。图5A 中的相对重要性的求和结果在图5B中示出。

再次参见图3,在完成S303的处理之后,字重要性确定器220将具有高相对重要性 的每个字与储存在关键字数据库中的用户定义关键字进行比较(S304)。在一个实施例中, 如果特定的字具有等于或高于预定值的相对重要性值,则所述特定的字被确定为是具有 高相对重要性的字。在另一个实施例中,将具有比其他字更高的相对重要性值的预定数 目的特定的字确定为是具有高相对重要性的字。所述预定数目可以对应于用户所请求的 关键字的数目。

当至少一个用户定义关键字与具有高相对重要性的至少一个字相匹配时,字重要性 确定器220可以将储存在关键字数据库中的用于所述至少一个用户定义关键字的权重应 用于匹配的字,因而确定出匹配的字的权重(S305和S306)。

字重要性确定器220可以通过对[PATENT]、[KEYWORD]、[EVENT]、 [MEASUREMENT]、[KOREA]、[JAVA]、[BANK]和[SEOUL]的相对重要性和基于储存 在关键字数据库中的用于用户定义关键字的权重所获得的用于[PATENT]、[JAVA]、 [EVENT]和[KEYWORD]的权重执行算术运算(例如,乘法),来确定[PATENT]、 [KEYWORD]、[EVENT]、[MEASUREMENT]、[KOREA]、[JAVA]、[BANK]和[SEOUL] 的加权重要性。图6示出作为S305和S306的过程的结果而确定出的[PATENT]、 [KEYWORD]、[EVENT]、[MEASUREMENT]、[KOREA]、[JAVA]、[BANK]和[SEOUL] 的加权重要性。

在一个实施例中,当从用户接收到用户定义关键字和用于所述用户定义关键字的权 重时,重要关键字提取系统100按字母顺序将所述用户定义关键字分类,以及将分类的 用户定义关键字及其权重储存在关键字数据库中。例如,当从用户接收到[PATENT, JAVA,EVENT和KEYWORD]和权重[1.3,1.7,1.1和0.7]时,字重要性确定器220按 字母顺序将[PATENT,JAVA,EVENT和KEYWORD]分类,以及沿着图4中所示的方 向a以[EVENT,JAVA,KEYWORD和PATENT]和权重[1.1,1.7,0.7和1.3]的顺序来 将分类的用户定义关键字储存在关键字数据库中。

在另一个实施例中,当从用户接收到用户定义关键字时,重要关键字提取系统100 可以分析所述用户定义关键字的相对重要性以确定所述用户定义关键字的权重,然后按 字母顺序将所述用户定义关键字分类并且将分类的用户定义关键字及其权重储存在关键 字数据库中。在一些实施例中,用户定义关键字的权重可以基于在过去检测出的字的频 率或者基于用户的意图来确定。

在一个实施例中,字重要性确定器220可以分析在一个或更多个文件中检测出的字 的词法语义,以检测与至少一个用户定义关键字相似的字。例如,当用户定义关键字对 应于[KEYWORD]时,字重要性确定器220可以分析在一个或更多个文件中检测出的字 的词法语义,并且将与[KEYWORD]相似的[KEY POINT]检测作为与[KEYWORD]相似 的字。

字重要性确定器220基于在一个或更多个文件中检测出的字的缩写来搜索关键字数 据库,以将储存在关键字数据库中的用户定义关键字与每个字进行比较。例如,当 [EVENT]、[JAVA]、[KEYWORD]和[PATENT]储存在关键字数据库中,并且在一个或 更多个文件中检测出[PATENT,KEYWORD,EVENT,MEASUREMENT,KOREA, JAVA,BANK和SEOUL]时,字重要性确定器220可以基于[PATENT]的缩写[P]来搜索 关键字数据库,以确定在关键字数据库中是否包括字[PATENT]。

再次参见图3,关键字提供器230将根据字的加权重要性确定出的至少一个字提供 至用户作为重要关键字(S307)。

关键字提供器230可以从用户接收包括与用户所请求的关键字的数目有关的信息的 请求,并且将具有与用户所请求的关键字的数目相对应的关键字提供给用户。例如,如 图7A中所示,当用户请求了5个关键字时,关键字提供器230可以提供具有高相对重 要性的5个关键字[MEASUREMENT]、[KEYWORD]、[BANK]、[PATENT]和[KOREA] 给用户。如图7B中所示,当关键字列表中的设置在关键字[MEASUREMENT]右侧的三 角形指示器被用户触发时,关键字提供器230可以利用组合框710来提供与 [MEASUREMENT]相似的字[MENSURATION]、[OBSERVATION]和[SURVEY]。在本 文中,由附图标记701表示的激活的三角形指示器指示存在相似的字,而由附图标记702 表示的未被激活的三角形指示器指示不存在相似的字。在另一个实施例中,如图7C中 所示,当关键字列表中的设置在字[MEASUREMENT]右侧的激活的三角形指示器被用户 触发时,关键字提供器230可以利用组合框720提供与[MEASUREMENT]被检测到的文 件有关的信息。在另一个实施例中,在关键字附近可以设置两个不同的指示器。在本实 施例中,如果两个指示器都被激活,则一个指示器在触发时指示相似的字,而另一个指 示器在触发时指示关键字出现的文件。

图8说明根据本公开的一个实施例的重要关键字提取服务器110B的简化视图。

重要关键字提取服务器110B包括处理器或CPU 821,其通过总线822与各种其他 的部件通信。重要关键字提取服务器110B中的这些其他的部件包括,但是不限于:作为 存储器823的非暂存性计算机可读存储媒介,包括只读存储器(ROM)824和随机存取 存储器(RAM)825,以及还有用作本地数据库的更高容量的非暂存性计算机可读存储 媒介826。

重要关键字提取服务器110B可以利用这些部件中的一个或更多个,以储存包括用 于提取重要关键字的指令的计算机代码。

重要关键字提取服务器110B还包括网络接口元件827。该网络接口元件827被配置 成允许信息在重要关键字提取服务器110B和网络130之间通信。这种信息可以包括能够 在重要关键字提取服务器110B上执行的代码以及来自用户终端120的一个或更多个文 件、请求、用户定义关键字以及用于用户定义关键字的权重等。

处理器821可以配合图8中所示的其他部件,根据诸如参照图2至图7C所述的实 施例来执行方法。

根据本公开的实施例,前述方法可以被实施为计算机可读代码,所述计算机可读代 码可以通过计算机来读取和执行并且储存在非暂存性计算机可读媒介上。计算机可读媒 介可以包括任何类型的记录设备,在所述记录设备中储存有能够通过计算系统读取的数 据。计算机可读记录媒介的实例包括:只读存储器(ROM)、随机存取存储器(RAM)、 光盘-只读存储器(CD-ROM)、磁带、软盘和光学数据储存器。计算机可读媒介可以分 布在与网络耦接的计算机系统之上,使得计算机可读代码可以采用分布式来储存和执行。

在另一个实施例中,重要关键字提取服务器110B可以使用诸如输入/输出设备的一 个或更多个其他的部件。

尽管本文件提供了本发明的实施例的描述,但本领域的技术人员将理解的是,在不 脱离所附权利要求所限定的技术原理和范围的情况下,可以采用各种方式来修改或改变 实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号