首页> 中国专利> 用于改进对新闻文章分级的系统和方法

用于改进对新闻文章分级的系统和方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种用于分级结果的系统。该系统可以接收链接的列表。该系统可以识别出与每个链接相关联的源，并且至少部分基于所识别出的源的质量对该链接的列表分级。

著录项

公开/公告号CN101826115A

专利类型发明专利
公开/公告日2010-09-08

原文格式PDF
申请/专利权人 GOOGLE公司;
展开▼

申请/专利号CN201010198508.9
发明设计人迈克尔·科蒂斯;科里什纳·伯哈雷特;迈克尔·施米特;
展开▼

申请日2004-09-14
分类号G06F17/30(20060101);
代理机构中国国际贸易促进委员会专利商标事务所;
代理人杜娟
地址美国加利福尼亚
入库时间 2023-12-18 00:44:04

法律信息

法律状态公告日

法律状态信息

法律状态
2018-02-09

专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20040914

专利权人的姓名或者名称、地址的变更
2016-08-17

授权

授权
2010-10-27

实质审查的生效 IPC(主分类):G06F17/30 申请日:20040914

实质审查的生效
2010-09-08

公开

公开

说明书

本申请是申请号为200480026722.9，申请日期为2006年3月16日，发明名称为“用于改进对新闻文章分级的系统和方法”的申请的分案申请。

技术领域

本发明一般地涉及通信系统，更具体地说，涉及用于改进通信系统中的对新闻文章分级的系统和方法。

背景技术

诸如因特网之类的网络已成为日常生活的日益重要的部分。现在，数以百万的人天天访问因特网购买商品和服务，获得感兴趣的信息(例如，电影列表、新闻等)，与朋友、家人和同事通信(例如，经由电子邮件和即时消息)。

现在，当希望在因特网上购买产品或仅仅寻找信息时，会在他/她的web浏览器输入关于感兴趣的web站点的统一资源定位符，以便访问特定的web站点。然后确定在该特定站点感兴趣的信息是否可用。

例如，假设有人希望经由因特网获得关于特定主题的最新新闻。它就访问包括传统的搜索引擎的web站点。将一个或多个与感兴趣的主题相关的项(例如“Iraq”)输入到搜索引擎中，试图定位已发布了关于该主题的文章的新闻源。这样，使用搜索引擎定位提供了与期望主题相关的新闻文章的各个网站，从而产生数百甚至数千个“点击”的经分级列表，其中每个点击可能与涉及这(一个或多个)搜索项的web页面相对应。

尽管该经分级列表中的每个点击可能涉及期望主题，但是与这些点击相关联的新闻源可能具有不同的质量。例如，大多认为CNN和BBC是报道准确、撰写专业等等的高质量源，而本地新闻源(例如，家乡的新闻源)可能是低质量的。

因此，需要系统和方法来基于与新闻文章相关联的的新闻源的质量来改进对新闻文章的分级。

发明内容

符合本发明原理的实现方式至少部分基于与新闻文章相关联的多个新闻源的质量来调整文章的分级。

根据符合本发明原理的一种实现方式，提供了一种用于分级结果的方法，该方法包括：接收链接的列表；针对每个链接识别出与该链接相关联的源；至少部分基于所识别出的源的质量对链接的列表分级。

在符合本发明原理的另一种实现方式中，一种服务器包括处理器和配置为存储一组源的质量指示符的存储器。处理器可以接收对象的列表，识别出与这些对象中的每个对象相关联的源，并且至少部分基于与对象的列表中的至少一个对象被关联到的源相关联的质量指示符来对所述对象分级。

在符合本发明原理的另一种实现方式中，提供了一种用于确定新闻源的质量的方法。该方法可以包括：至少部分基于下述中的至少一个来确定该新闻源的一个或多种度量值：在第一时间段中新闻源产生的文章数目；新闻源产生的文章的平均长度；在第二时间段中新闻源产生的重要报道的量；爆炸性新闻分数；到新闻源的网络流量；人们对新闻源的评价；新闻源的发行统计；与新闻源相关联的职员多少；与新闻源相关联的办事处的数目；在与新闻源相关联的一组文章中原始指名实体的数目；新闻源的覆盖幅度；到新闻源的流量源自的不同国家的数目；以及新闻源使用的写作风格。该方法还包括至少部分基于所确定的一个或多种度量值来计算新闻源的质量值。

在符合本发明原理的另一种实施方式中，提供了一种用于提供搜索结果的方法。该方法可以包括接收对象的列表；识别出与该组对象中的每个对象相关联的源；确定所识别出的源中的每个源的质量；以及至少部分基于所确定的与该组对象中的每个对象相关联到的源的质量来对该对象分级。

附图说明

结合于此并组成本说明书一部分的附图图示了本发明的实施例，并且与详细描述一起解释本发明。在附图中，

图1是符合本发明原理的系统和方法可以在其中实现的系统的示例图；

图2是在符合本发明原理的实现方式中的图1的服务器的示例图；

图3是在符合本发明原理的实现方式中可以与图2的服务器相关联的数据库的示意图；

图4是在符合本发明原理的实现方式中用于确定新闻源的源等级的示例过程的流程图；

图5是在符合本发明原理的实现方式中用于调节对象分级的示例过程的流程图；

具体实施方式

下面符合本发明原理的实现方式的详细描述参考附图。在不同的图示中相同的标号可以识别相同的或相似的元素。另外，下面的详细描述不限制本发明。

符合本发明原理的实现方式至少部分基于与新闻文章相关联的源的质量来改进对搜索结果中的新闻文章的分级。尽管前述描述集中于对来自新闻源的新闻文章分级，但是应当理解，这里所述的技术同样适用于改进对除了新闻文章之外的其他项目分级。

示例性系统

图1是系统100的示例图，在系统100中，可以实现符合本发明原理的系统和方法。系统100可以包括多个客户机110，客户机110经由网络140连接到服务器120和130。网络140可以包括局域网(LAN)、广域网(WAN)、电话网(例如，公共交换电话网，PSTN)、内联网、因特网、相似的或不同的网络、或者这些网络的组合。出于简化，在图1中两个客户机110和三个服务器120/130被示作连接到网络140。实际上，可以有更多或更少的客户机110和/或服务器120/130。另外，在某些实例中，客户机110可以执行服务器120/130的功能，并且服务器120/130可以执行客户机110的功能。

客户机110可以包括设备，例如，无线电话、个人计算机、个人数字助理(PDA)、膝上型电脑等，以及在这些设备上运行的线程或进程，以及/或者可由这些设备执行的对象。服务器120/130可以包括服务器设备，线程，以及/或者以符合本发明的原理的方式操作、搜索或者维护文档的对象。客户机110和服务器120/130可以经由有线、无线或光连接而连接到网络140。

在符合本发明原理的实现方式中，服务器120可以包括由客户机110使用的搜索引擎125。服务器130可以存储可由客户机110访问的对象(或者web文档)。

示例性服务器配置

图2是符合本发明原理的实现方式中的服务器120的示例图。客户机110和服务器130可以类似地配置。服务器120可以包括总线210、处理器220、主存230、只读存储器(ROM)240、存储设备250、一个或多个输入设备260、一个或多个输出设备270、以及通信接口280。总线210可以包括允许在服务器120的组件之间通信的一个或多个导线。

处理器220可以包括可以解释并执行指令的任意类型的传统处理器或微处理器。主存230可以包括随机访问存储器(RAM)或其他类型的动态存储器件，存储用于处理器220执行的信息和指令。ROM 240可以包括传统的ROM器件或其他类型的静态存储器件，存储用于由处理器220使用的静态信息和指令。存储设备250可以包括磁和/或光记录介质及其相应的驱动器。

输入设备260可以包括允许用户将信息输入到服务器120的一种或多种传统机制，例如，键盘、鼠标、笔、一种或多种生物测定学(biometric)机制(例如语音识别设备)，等等。输出设备270可以笔将信息输出到用户的一种或多种传统机制，包括显示器、打印机、扬声器等。通信接口280可以包括任何类似收发器的机制，其使服务器120能够与其他设备和/或系统通信。例如，通信接口280可以包括用于经由网络(例如，网络140)与另一个设备或系统通信的机制。

如下面将详细描述的，符合本发明原理的服务器120可以响应于来自客户机110的查询改进搜索结果。在一种实现方式中，服务器120基于提供新闻文章的源的质量对新闻文章搜索结果进行修改。服务器120可以响应于处理器220执行计算机可读介质(例如，存储器230)中包含的软件指令来执行这些操作。计算机可读介质可以被限定为一种或多种存储器器件和/或载波。软件指令可以从另一种计算机可读介质(例如，存储设备250)被读入到存储器230中，或者经由通信接口280从另一个设备读入到存储器230中。存储器230中包含的软件指令可以致使处理器220执行稍后将描述的过程。或者，硬连线的电路可以用来替换软件指令或者与软件指令组合使用来实现符合本发明原理的过程。因此，本发明不受限于硬件电路和软件的任意特定组合。

符合本发明原理的服务器120可以基于来自一个或多个关联数据库的信息来对搜索结果的分级进行分级或修改。这些数据库可以被存储在服务器120处(例如，在存储器230中)或者存储在服务器120外。

图3是数据库300的示例图，在符合本发明原理的实现方式中，数据库300可以与服务器120相关联。经管下面只描述一个数据库，但是应当意识到服务器120可以与一个或多个额外的数据库(未示出)相关联，这些额外的数据库本地地存储在服务器120处，或者分布在网络140上。

如上所述，数据库300可以包括源字段310和源等级字段320。数据库300可以包括额外的字段(未示出)，这些额外的字段帮助搜索和分类数据库300中的信息和/或自网络140接收到的信息。

在系统100中，源字段310可以识别新闻源。标记为1到N(其中N是大于等于1的数字)的新闻源可以包括本地新闻源(例如，本地在线报纸或本地电视台网站)，全国新闻源、国际新闻源、专业新闻源(例如，技术、体育或娱乐杂志或报纸)和/或来自网络(例如，因特网)的任何其他类型的新闻源。例如，新闻源可以包括WashingtonPost、CNN、MSNBC、BCC、the New York Post、USA Today、the Pittsburgh Post-Gazette、ESPN、Sports Illustrated等的在线版。

源等级字段320可以存储这样的值，该值可用于对从在源字段310中识别出的源提取的文章(或者文档)的等级进行调整。这样，可以将来自较高质量新闻源的文章的等级调整为比来自较低质量的新闻源的同样主题的文章的高。下面将详细描述，给定新闻源的值可以至少部分基于该新闻源的可信性、报告准确度、写作专业性等。

示例性处理

图4是在符合本发明原理的实现方式中用于确定新闻源的源等级的示例过程的流程图。下面所述的过程可以由例如服务器120自动执行，或者由人员操作员手动执行。在替换实现方式中，下面所述过程的多个部分可以被自动执行，而其他部分可以被手动执行。

处理可以开始于考虑每个新闻源的一组度量(动作405)。每种度量可以测量新闻源的特定属性，该特定属性可以充当新闻源的质量的部分指示符。在符合本发明原理的一种实现方式中，每种度量可以作为数值计算，其中例如计算出的较高的值可能指示较高质量的新闻源。

在下面将详细解释，该组度量可以包括在给定时间段中由新闻源产生的文章的数目、来自该新闻源的文章的平均长度、来自该新闻源的报道的重要性、爆炸性新闻分数、使用模式、人群评价、发行统计、与该新闻源相关联的职员多少、与该新闻源相关的新闻办事处数目、在文章簇(cluster)中该新闻源产生指名实体的数目、覆盖幅度、国际多样性、写作风格等。确定新闻源的质量的第一度量可以包括在给定时间段中由该新闻源产生的文章的数目。该时间段可以是一周、双周、月等。在符合本发明原理的一种实现方式中，第一度量可以通过对在一时间段上该新闻源产生的非重复文章的数据进行计数来确定。在替换实现方式中，第一度量可以通过对由该新闻源产生的原始句子的数目进行计数来确定。

第二度量可以包括来自该新闻源的文章的平均长度。该平均产度可以例如按词或句子测量。在符合本发明原理的一种实现方式中，第二度量可以通过确定由该新闻源产生的非重复文章的平均长度来确定。例如，可以确定来自CNN的文章的平均长度为300个词，而来自Amateur News Network的文章的平均长度为150个词。因此，CNN的第二度量的值可以为300，而Amateur News Network的可以为150。

第三度量可以包括该新闻源的报道的重要性。该度量可以至少部分基于可以确定给定文章的背后新闻记事的“大小”(下文中称作“记事大小”)这样的假设。该度量可以为代表在固定时间段内所考虑的新闻源产生的所有非重复文章的记事大小分数的总值。该时间段可以是一周、双周、月等。作为示例，如果D为文章，则D的记事大小可以作为该系统(例如，服务器120)已知的关于相同主题的不同的其他文章的数目而被测量出。例如，如果D是关于哥伦比亚航天飞机坠毁的文章，并且存在500篇关于该主题的不同文章，则该记事大小应为500。存在许多用于检测关于该记事的其他文章的技术。例如，在下述共同未决、共同转让的专利申请中描述了两类这种技术，所述专利申请是：2003年6月30日提交的题为“Methods and Apparatus for RankingDocuments”的美国专利申请No.10/611,267，以及2003年6月30日提交的题为“Methods and Apparatus for Clustered Aggregation ofNews Content，”的美国专利申请No.10/611,269，这二者都通过引用明确整体结合于此。一组相关的文章在下文中称作“簇”。在符合本发明原理的一种实现方式中，度量值可以被限制为在规定的时间段上由给定的源覆盖的最大的N个记事的记事大小，其中N是大于等于1的正整数(例如，在1周中服务器120测量的由CNN覆盖的最大100个记事)。

第四度量可以包括代表爆炸性新闻分数的值。该度量可以测量新闻源在重要事件发生后立即发表记事的能力。该度量可以对来自新闻源的每篇非重复文章的“爆炸性分数”进行平均，其中爆炸性分数例如是这样的数字，如果在新闻事件发生后立即发表文章则该数字为较高的值，如果在从新闻记事发生起已经过很多时间后才发表文章则该数字为较低的值。

在符合本发明原理的一种实现方式中，以递增顺序按照发表时间对簇中的所有文章进行分类，并且第一篇文章的时间作为事件的时间。例如，假设T是当前文章和第一篇文章之间的时间差。阈值N1可用于标注这样的间隔，在该间隔之后不再考虑记事的爆炸性。因此，爆炸新闻分数度量可以如下确定(breaking_source：爆炸性分数)：

如果T＞N1，则breaking_score＝0；

如果0＜T≤N1，则breaking_score＝log(Nl/T)；并且

如果T＝0，则breaking_score＝log(Nl)。

N1可以以小时表示，例如3小时。

在符合本发明原理的另一种实现方式中，以递增顺序按照时间对簇中的所有文章进行分类，并且每篇文章的等级作为上述值T。相应地，可以使用阈值N2。因此，爆炸新闻分数度量可以如下确定：

如果T＞N2，则breaking_score＝0；并且

如果1＜T≤N2，则breaking_score＝log(N2/T)。

在一种示例性实现方式中，N2可以为10。

在又一种符合本发明原理的实现方式中，如上确定的爆炸性新闻分数可以被乘以这样的量，该量与给定文章所属的相关文章簇的大小成正比。例如，爆炸性新闻分数可以被乘以因子＝(1+log(簇大小))。这在记事重要并且看来要形成大簇时突出爆炸性新闻的值。

在又一种实现方式中，不是对爆炸性分数值求平均，而是如果簇大小大于遇到值(例如，30)，则对这些值求和。因此，在这种情形中，爆炸性新闻分数可以如下确定：

对于每篇文章A(size：大小；Breaking_new：爆炸性新闻；cluster：簇；Score：分数；rank_within_cluster：簇内等级)：

如果(Size(cluster(A)))＞30)：

Breaking_news[score(A)]+＝30-rank_within_Cluster(A)。

第五度量可以包括代表使用模式的值。可以针对使用(例如，点击)来监控从新闻搜索引擎的网页到各个文章的链接。常常被选择的新闻源被检测出，并且被分配与所观察到的使用成正比的值。公知的站点例如CNN倾向于优于不流行的站点，例如不知名的小镇新闻，用户可能避开这种新闻。所测量出的流量可以用读者可能访问该链接的机会的数目归一化，以避免由于新闻搜索引擎的分级偏好导致的测量偏离。

第六度量包括代表人群对新闻源的评价的值。在符合本发明原理的一种实现方式中，一般可以对用户进行民意测验来识别用户喜欢阅读(或者已访问过)的报纸(或者杂志)。作为替换或者附加地，可以对新闻搜索引擎的用户进行民意测验来确定用户喜欢访问的新闻网站。也可以使用其他机构对新闻站点的评估(例如，可以至少部分基于报纸已获得的Pulitzer奖的次数等对报纸进行比较)。此外，新闻源的年龄也可以作为公众信任的测量，并且可用作一种度量。在另一种实现方式中，可以向评估者出示来自各个新闻源选出的文章，并且要求给每个源分配一个分数。该分配的分数可以作为一种度量。

第七度量可以包括代表新闻源的发行统计的值。诸如MediaMetrix和Nielsen Netratings等机构发布在线站点(例如，新闻站点)的使用统计。这些发布的流量数字可以用作对新闻源的质量的测量。在符合本发明原理的一种实现方式中，与新闻站点相关联的印刷报纸的发现统计可作为一种度量。

第八度量可以包括代表与新闻源关联的职员数目的值。在符合本发明原理的一种实现方式中，可以至少部分基于在来自新闻源的文章中提到的不同记者的数目确定。

第九度量可以包括代表与新闻源关联的新闻办事处的数目的值。

第十度量可以包括代表下述原始指名实体的数目的值，所述原始指名实体的数目是在例如具有至少N篇相关文章(例如，N＝3)的所有文章上平均的、新闻源在相关文章的簇内产生的原始指名实体的数目。指名实体可以对应于个人、位置或组织。如果新闻源生成包含同一簇内的其他文章(从而关于同一话题)不包含的指名实体的新闻记事，则这可能指示出该新闻源能够发出原始报道。在这种分析中，由在阈值大小为N的簇中给定的新闻源添加的平均值被评估。在符合本发明实施例的一种实现方式中，如果簇中没有较早的文章具有相同的指名实体，则可以考虑该指名实体。可以使用近似字符串匹配来对指名实体进行比较，以补偿拼写和缩写的变体。与其他文章中的指名实体显著不同的指名实体可以认为是原始的。

第十一度量可以包括代表新闻源的幅度的值(例如，新闻源产生的内容涉及的话题的数目)。在符合本发明原理的一种实现方式中，来自新闻源的文章可以分类到一组话题(例如，艺术、音乐、体育、商业等)中，并且话题的范围可以用作幅度的测量。可以使用任何传统分类技术来奖文章分类到多种话题中。例如，根据机器学习文献的分类系统可以用来将新闻文章分类到选出的一组话题中。在另一种实现方式中，由新闻源发表的章节数可以作为幅度的测量。

第十二度量可以包括代表新闻源的国际多样性的值。该度量可以测量新闻站点从其接收网络流量的国家的数目。在符合本发明原理的一种实现方式中，通过考虑到新闻站点的已知访问者所来自的国家，可以测量出该度量(例如，至少部分基于点击从搜索站点到正被测量的新闻源的文章的链接的那些用户的因特网协议(IP)地址)。基于已知IP块到国家的映射的表，可以将相应IP地址映射到起源国家。在另一种实现方式中，可以监控链接到给定新闻web站点的那些web站点的IP地址，该新闻站点从其被链接的不同国家的数目可以作为该度量。

第十三度量可以包括代表新闻源使用的写作风格的值。可以使用用于测量拼写正确性、语法和阅读水平的自动测试来生成反应写作风格的度量值。然后可以分配与测量出的写作风格成正比的分数。

应当意识到，除了上述度量组或者作为对上述度量组的替换，可以考虑其他度量。例如，另一种度量可以包括代表到新闻web站点的超链接的数目的值。

一旦已考虑了一组度量，就可以至少部分基于该组度量来确定每个新闻源的源等级(动作410)。为了确定每个新闻源的源等级，上述该组度量的一些或全部可以被组合来产生新闻源的最终分数(即，源等级)。可以使用许多技术来确定新闻源的源等级。例如，在符合本发明原理的一种实现方式中，每种度量可以被乘以相应的因子，并且所产生的值可以被总计，以给出新闻源的源等级。或者，每种度量可以被归一化到0到1的范围内，并且所产生的值可以被总计来给出最终度量值(即，源等级)。例如，可以通过将每种度量值除以该度量分配的最大可能值，从而实现归一化。

在另一种实现方式中，可以计算出新闻源的各种度量的平均等级。例如，如果CNN具有发行统计等级1，国际流行度等级2，以及国际办事处数目等级9，则仅考虑这些度量CNN具有平均分级(1+2+9)/3＝4。

在又一种实现方式中，对于每个新闻源，相对于每种度量的最佳新闻源的该种度量的百分比分数可以用于确定该新闻源的分数分级。例如，如果CNN具有国际流行度等级2，并且BBC具有该度量的最高等级10，则CNN的该度量的百分比分数可以为0.2。

作为对上述的替换，上述技术之一可以仅与正被考虑的给定新闻源的最好的N种度量一起使用。N可以是大于等于一的正整数。在一种实现方式中，N可以为5。通过对给定新闻源仅考虑最好的N种度量，这允许结合某些度量还未被计算出的新闻源。

一旦已确定出新闻源的源等级，则服务器120可以存储该源等级(动作415)。在一种实现方式中，服务器120可以将新闻源的识别与相应的源等级值存储到数据库中，例如数据库300。

图5是在符合本发明原理的实现方式中用于调节对象(例如，新闻文章)的等级的示例过程的流程图。尽管下面的描述集中于作为搜索查询结果提取出的分级对象，但是符合本发明原理的实现方式不受限于此。实际上，符合本发明原理的实现方式同样适用于根据打分标准对新闻文章分级的系统和方法。该标准例如可以包括查询(例如，将在下面的示例性场景中描述的搜索引擎查询)、话题(例如，体育)、关键字列表(例如，来自搜索结果文档的初始集合的关键字)、地理区域(例如，纽约)、文章簇中的文章列表、或者示例性文档集合。

处理可以开始于用户使用例如客户机(例如，客户机110)上的web浏览器软件访问服务器120(图1)。然后用户可以项由服务器120维护的搜索引擎125提供包括一个或多个搜索项的查询(动作505)。在一种实现方式中，搜索查询包括与新闻话题有关的一个或多个项。例如，如果用户想阅览关于George Bush的新闻文章，则用户可以使客户机110向服务器120发送具有搜索项“George Bush”的搜索查询。

响应于接收到搜索项，服务器120可以以传统方式生成分级后的结果列表(动作510)。这些结果可以包括对新闻文章的引用(例如，链接)，并且可能包括对链接的文本描述。服务器120可以针对分级的列表中的每个链接确定链接是否与已针对其确定了源等级的新闻源相对应。为了确定对于链接是否存在源等级，服务器120可以首先识别出链接对应的新闻源(动作515)。在一种实现方式中，服务器120可以至少部分基于与链接相关联的统一资源定位符(URL)识别新闻源。例如，服务器120可以确定出链接“www.cnn.com/2003/abc/index.html”对应于新闻源“CNN”。可以替换地使用用于识别链接的对应的新闻源的其它技术。

一旦已识别出新闻源，服务器120就可以通过例如访问数据库300并且确定与链接相对应的新闻源是否被存储在源字段310中，从而确定对于该链接是否存在源等级(动作520)。如果新闻源在源字段310中不存在，则服务器120不能调整该链接的分级。另一方面，如果该新闻源在源字段310中存在，则服务器120可以从源等级字段320提取出该新闻源的源等级。然后服务器120可以至少部分基于提取出的源等级来调整与该新闻源相对应的链接的分级(动作520)。

给定链接的初始分级R1，服务器120可以通过针对每个链接计算改进后的分数，从而产生调整后的分级R2。服务器120可以通过将与R1中的分级相对应的分数和与链接相关联的新闻源的源等级组合，从而确定出新分数。在符合本发明原理的一种实现方式中，服务器120可以将新分数确定为加权的和。例如，服务器120可以如下确定链接的新分数(NEWSCORE：新分数；OLDSCORE：旧分数；SOURCERANK：源等级)：

NEWSCORE(D)＝α＊OLDSCORE(D)+β＊SOURCERANK(SOURCE(D))

其中SOURCE(D)是链接D的新闻源，并且α和β是适当的常数。例如，在符合本发明原理的一种实现方式中，α可以被设置为0.8，β可以被设置为0.2。应当意识到，可以替换使用其他α和β值。也可以替换使用用于调整链接的分级的其他技术，例如，对R1分数和源等级求平均。这样，可以产生新链接的改进的分级。

一旦已调整了分级后列表，服务器120就可以向客户机110提供调整后的链接分级列表(动作525)。服务器120可以经由网络140将调整后的链接列表发送到客户机110。

在符合本发明原理的其他实现方式中，在动作510中，服务器120可以响应于接收到搜索查询，提取出未分级的结果列表。在这种情形中，服务器120可以基于与结果列表所关联到的新闻源相关联的源等级来对结果列表分级。

结论

符合本发明原理的实现方式可以至少部分基于与新闻文章相关联的新闻源的质量来改进对新闻文章的分级。

前面对本发明的示例性实施例的描述提供了说明和描述，但是不是要穷尽本发明或者将本发明限制于所公开的精确形式。根据上述教导，可以做出修改和改变，并且实施本发明可能要求修改和改变。例如，不需要由服务器120执行上述功能。在其他实现方式中，可以由客户机110执行图5中描述的一个或多个动作。例如，浏览器助手(即，与传统web浏览器一起工作的软件)可以执行参考图5的过程描述的一个或多个动作。

此外，如上所述，符合本发明原理的实现方式不受限于分级新闻文章。例如，符合本发明原理的实现方式可以用于对可以通过网络提取出或从一个或多个数据库提取出的其他类型的项目进行分级。

尽管已参考图4和图5描述了动作序列，但是在符合本发明的其他实现方式中这些动作的顺序可以改变。此外，可以并行实现无依赖关系的动作。

在本申请的描述中使用的元素、动作或指令不应当被解释为对本发明关键或必须的，除非明确描述我如此。另外，这里所使用的名词是要包括一个或多个项目。在仅要一个项目的地方，明确使用“一个”或类似的语言。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于改进对新闻文章分级的系统和方法 [P] . 中国专利： CN101826115B . 2016.08.17
2. 用于改进对新闻文章分级的系统和方法 [P] . 中国专利： CN1853183A . 2006-10-25
3. Method and system for dynamically providing contextually relevant news based on an article displayed on a web page [P] . 美国专利： US10452727B2 . 2019-10-22

机译：用于基于网页上显示的文章动态提供上下文相关新闻的方法和系统
4. System and method for focal-plane illuminator/detector (FASID) design for improved graded index lenses [P] . US10969300B2 . 2021-04-06

机译：用于改进分级索引镜头的焦平面照明器/检测器（FASID）设计的系统和方法
5. SYSTEM AND METHOD FOR FOCAL-PLANE ANGULAR-SPATIAL ILLUMINATOR/DETECTOR (FASID) DESIGN FOR IMPROVED GRADED INDEX LENSES [P] . EP3729148A4 . 2021-09-01

机译：用于改进分级索引镜头的焦平面角空间照明器/检测器（FASID）设计的系统和方法