首页> 中国专利> 点击模型确定方法、搜索方法、装置、服务器及介质

点击模型确定方法、搜索方法、装置、服务器及介质

摘要

本公开关于一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质。点击模型确定方法,包括:通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。

著录项

  • 公开/公告号CN113254734A

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利权人 北京达佳互联信息技术有限公司;

    申请/专利号CN202110559194.9

  • 发明设计人 张志伟;李岩;

    申请日2021-05-21

  • 分类号G06F16/9035(20190101);G06F16/9038(20190101);

  • 代理机构44224 广州华进联合专利商标代理有限公司;

  • 代理人梁皓茹

  • 地址 100085 北京市海淀区上地西路6号1幢1层101D1-7

  • 入库时间 2023-06-19 12:13:22

说明书

技术领域

本公开涉及信息搜索技术领域,尤其涉及一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质。

背景技术

随着信息搜索技术的发展,出现了一种利用用户的后验数据调整信息搜索结果的技术,该技术可以根据用户针对于搜索结果反馈的后验数据,例如用户对显示的搜索结果中各结果的点击率,点赞率或者用户评论的数量等等,对用于进行搜索的点击模型进行更新,以使得优质的搜索结果具有更突出的排列位置。

相关技术中,目前对信息搜索结果的调整主要是通过对使用的点击模型的模型参数进行调整,通过改变点击模型的模型参数使得模型输出的搜索结果的排列位置也发生相应改变。然而,对点击模型的模型参数进行调整,虽然总体上可以提高搜索结果的质量,但对于某些特定的搜索信息,其搜索结果的质量反而会下降,点击模型输出的搜索结果质量较低。

发明内容

本公开提供一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质,以至少解决相关技术中点击模型输出的搜索结果质量低的问题。本公开的技术方案如下:

根据本公开实施例的第一方面,提供一种点击模型确定方法,包括:

通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定所述样本搜索词的第二搜索结果;

确定所述第一搜索结果对应的第一评价信息,以及确定所述第二搜索结果对应的第二评价信息;

根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型。

在一示例性实施例中,所述确定所述第一搜索结果对应的第一评价信息,包括:获取针对于所述第一搜索结果的后验数据;根据所述后验数据确定所述第一搜索结果对应的第一评价信息。

在一示例性实施例中,所述第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;所述根据所述后验数据确定所述第一搜索结果对应的第一评价信息,包括:获取所述每个第一搜索结果对应的各个后验参数的参数权值;根据所述参数权值,对所述每个第一搜索结果的各个后验参数进行加权求和处理,得到所述每个第一搜索结果的评价系数;将所述每个第一搜索结果的评价系数的平均值,作为所述第一搜索结果对应的第一评价信息。

在一示例性实施例中,所述根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型,包括:若所述第二评价信息大于所述第一评价信息,则将所述新增点击模型作为所述样本搜索词的有效点击模型;所述第一评价信息用于表征针对于所述第一搜索结果的用户满意程度;所述第二评价信息用于表征针对于所述第二搜索结果的用户满意程度。

在一示例性实施例中,所述确定所述样本搜索词的有效点击模型之后,还包括:获取当前点击模型的当前搜索词个数;所述当前点击模型为所述有效点击模型中的任一点击模型;若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理。

在一示例性实施例中,所述若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理,包括:获取所述当前点击模型对应的初始搜索词个数;确定所述当前搜索词个数与所述初始搜索词个数的比例;若所述比例小于预设的比例阈值,将所述当前点击模型进行删除处理。

在一示例性实施例中,所述若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理,包括:若所述当前搜索词个数小于预设的搜索词个数阈值,将所述当前点击模型进行删除处理。

根据本公开实施例的第二方面,提供一种搜索方法,包括:

获取搜索词信息,以及获取与所述搜索词信息匹配的有效点击模型;所述有效点击模型由第一方面中任一项实施例所述的点击模型确定方法所确定;

将所述搜索词信息输入所述有效点击模型,通过所述有效点击模型输出所述搜索词信息对应的搜索结果。

根据本公开实施例的第三方面,提供一种点击模型确定装置,包括:

搜索结果获取单元,被配置为执行通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定所述样本搜索词的第二搜索结果;

评价信息确定单元,被配置为执行确定所述第一搜索结果对应的第一评价信息,以及确定所述第二搜索结果对应的第二评价信息;

点击模型确定单元,被配置为执行根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型。

在一示例性实施例中,评价信息确定单元,进一步被配置为执行获取针对于所述第一搜索结果的后验数据;根据所述后验数据确定所述第一搜索结果对应的第一评价信息。

在一示例性实施例中,所述第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;评价信息确定单元,进一步被配置为执行获取所述每个第一搜索结果对应的各个后验参数的参数权值;根据所述参数权值,对所述每个第一搜索结果的各个后验参数进行加权求和处理,得到所述每个第一搜索结果的评价系数;将所述每个第一搜索结果的评价系数的平均值,作为所述第一搜索结果对应的第一评价信息。

在一示例性实施例中,点击模型确定单元,进一步被配置为执行若所述第二评价信息大于所述第一评价信息,则将所述新增点击模型作为所述样本搜索词的有效点击模型;所述第一评价信息用于表征针对于所述第一搜索结果的用户满意程度;所述第二评价信息用于表征针对于所述第二搜索结果的用户满意程度。

在一示例性实施例中,点击模型确定装置,还包括:点击模型删除单元,被配置为执行获取当前点击模型的当前搜索词个数;所述当前点击模型为所述有效点击模型中的任一点击模型;若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理。

在一示例性实施例中,所述点击模型删除单元,进一步被配置为执行获取所述当前点击模型对应的初始搜索词个数;确定所述当前搜索词个数与所述初始搜索词个数的比例;若所述比例小于预设的比例阈值,将所述当前点击模型进行删除处理。

在一示例性实施例中,所述点击模型删除单元,进一步被配置为执行若所述当前搜索词个数小于预设的搜索词个数阈值,将所述当前点击模型进行删除处理。

根据本公开实施例的第四方面,提供一种搜索装置,包括:

点击模型获取单元,被配置为执行获取搜索词信息,以及获取与所述搜索词信息匹配的有效点击模型;所述有效点击模型由第一方面中任一项实施例所述的点击模型确定方法所确定;

搜索结果输出单元,被配置为执行将所述搜索词信息输入所述有效点击模型,通过所述有效点击模型输出所述搜索词信息对应的搜索结果。

根据本公开实施例的第五方面,提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面中任一项实施例所述的点击模型确定方法,或者实现如第二方面中任一项实施例所述的搜索方法。

根据本公开实施例的第六方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面中任一项实施例所述的点击模型确定方法,或者执行如第二方面中任一项实施例所述的搜索方法。

根据本公开实施例的第七方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项实施例所述的点击模型确定方法,或者实现第二方面中任一项实施例所述的搜索方法。

本公开的实施例提供的技术方案至少带来以下有益效果:

通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开可以通过得到确定新增点击模型与历史点击模型针对每一个搜索词的搜索结果的评价信息,并根据评价信息确定该样本搜索词的有效点击模型,实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种点击模型确定方法的流程图。

图2是根据一示例性实施例示出的获取第一评价系数的流程图。

图3是根据一示例性实施例示出的根据后验数据确定第一评价系数的流程图。

图4是根据一示例性实施例示出的显示第一搜索结果的界面示意图。

图5是根据一示例性实施例示出的删除点击模型的流程图。

图6是根据一示例性实施例示出的将当前点击模型进行删除处理的流程图。

图7是根据一示例性实施例示出的一种搜索方法的流程图。

图8是根据一示例性实施例示出的一种点击模型确定装置的框图。

图9是根据一示例性实施例示出的一种搜索装置的框图。

图10是根据一示例性实施例示出的一种服务器的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种点击模型确定方法的流程图,如图1所示,点击模型确定方法用于服务器中,包括以下步骤。

在步骤S101中,服务器通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果。

其中,服务器可以是用于实现搜索功能的搜索系统,该服务器中可以预先存储有多种点击模型,分别对应于不同的搜索策略,该服务器接收到需要进行搜索的搜索词时,可以通过调用预先存储的点击模型,利用点击模型得到搜索词对应的搜索结果,并将搜索结果按照点击模型对应的搜索策略进行排序,从而输出与搜索词对应的排序后的搜索结果,该服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。新增点击模型则是新加入该服务器中的点击模型,当开发出新的搜索策略对应的点击模型后,可以将该点击模型存入服务器中,作为新增点击模型,而历史点击模型则是预先存储在服务器中的点击模型,并且预先建立有与不同搜索词的对应关系。而第一搜索结果是利用历史点击模型得到的样本搜索词的搜索结果,而第二搜索结果则是利用新增点击模型得到的样本搜索词的搜索结果。

具体来说,当服务器得到新增点击模型后,可以获取用于测试新增点击模型的搜索性能的样本搜索词,样本搜索词可以是在新增点击模型加入服务器后,测试阶段中用户通过服务器进行搜索输入的任意搜索词,之后服务器可以根据上述预先建立的对应关系确定出每一个样本搜索词对应的历史点击模型。之后,服务器则可以分别利用历史点击模型以及新增点击模型分别对样本搜索词进行搜索,从而分别得到针对该样本搜索词的第一搜索结果以及第二搜索结果。

在步骤S102中,服务器确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息。

服务器分别得到样本搜索词的第一搜索结果以及第二搜索结果后,则可以分别得到用户针对得到的第一搜索结果的第一评价信息,可以是用户针对得到的第一搜索结果的用户评价,以及用户针对得到的第二搜索结果的第二评价信息,即用户针对得到的第二搜索结果的用户评价。

例如,对于样本搜索词A,在服务器中预先存储有与样本搜索词A对应的历史点击模型A,在新增点击模型B加入服务器时,如果用户需要对样本搜索词A进行搜索时,则可以将用户随机分为两类,分别利用历史点击模型A以及新增点击模型B输出针对样本搜索词A的第一搜索结果以及第二搜索结果,并分别获取第一搜索结果对应的第一评价信息,以及第二搜索结果的第二评价信息。

在步骤S103中,服务器根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。

有效点击模型则指的是最终用于对样本搜索词进行搜索的点击模型,有效点击模型可以是该样本搜索词的历史点击模型,和新加入服务器的新增点击模型中的任意一个。服务器在得到第一评价信息以及第二评价信息后,由于第一评价信息和第二评价信息可以反映用户的评价,因此服务器可以通过第一评价信息以及第二评价信息找出针对样本搜索词具有更高的用户评价的点击模型,作为最终的该样本搜索词的有效点击模型。

上述点击模型确定方法中,服务器通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开服务器可以通过得到确定新增点击模型与历史点击模型针对每一个搜索词的搜索结果的评价信息,并根据评价信息确定该样本搜索词的有效点击模型,实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。

在一示例性实施例中,如图2所示,步骤S102可以进一步包括:

在步骤S201中,服务器获取针对于第一搜索结果的后验数据;

在步骤S202中,服务器根据后验数据确定第一搜索结果对应的第一评价信息。

第一搜索结果的后验数据指的是用户针对第一搜索结果的反馈数据,例如可以是用户针对第一搜索结果的点击率,或者针对第一搜索结果的收藏率等等。服务器可以采集用户针对于第一搜索结果的后验数据,并利用得到的后验数据确定用户针对第一搜索结果的第一评价信息。

同理,服务器也可以将样本搜索词输入新增点击模型中,通过新增点击模型输出该样本搜索词的第二搜索结果,并获取用户针对第二搜索结果的后验数据,以及利用第二搜索结果的后验数据确定用户针对第二搜索结果的第二评价信息。

本实施例中,服务器可以根据得到的搜索结果的后验数据来得到其对应的评价信息,可以使得评价信息更符合用户的实际需要,相比根据类似视频相关度等先验数据得到评价系数,利用后验数据得到评价系数可以使搜索结果更加符合用户需要,进一步提高点击模型得到搜索结果的质量。

进一步地,第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;如图3所示,步骤S203可以进一步包括:

在步骤S301中,服务器获取每个第一搜索结果对应的各个后验参数的参数权值。

其中,第一搜索结果的数量可以是多个,如图4所示,在对某一个搜索词A进行搜索时,其得到的搜索结果可以包括搜索结果A、搜索结果B、搜索结果C以及搜索结果D,用户可以分别对不同的搜索结果进行相应的反馈,因此,服务器得到的每一个搜索结果都可以有与其对应的后验数据。同时,用户的反馈信息也可以是多种多样,例如对于某一个搜索结果的收藏率以及向其他用户推荐的推荐率等等,因此每一个搜索结果对应的后验数据也可以由不同的参数类型的后验参数组成,而参数权值则指的是每一个后验参数对评价系数的影响量,如果某一个后验参数对评价系数的影响量较大,则可以有更大的参数权值。

例如:不同数据类型的后验参数可以包括用户针对某个第一搜索结果的收藏率、关注率以及向其他用户进行推荐的推荐率,而得到的第一搜索结果可以包括搜索结果A以及搜索结果B,那么服务器则可以分别得到用户针对搜索结果A的收藏率A、关注率A以及推荐率A,以及用户针对搜索结果B的收藏率B、关注率B以及推荐率B。

具体来说,服务器可以采集每一个第一搜索结果对应的多个不同类型的后验参数,并确定每一个后验参数对应的参数权值,参数权值的确定可以是用户预先输入至服务器中,在得到每一个第一搜索结果的评价信息的过程中保持不变。

在步骤S302中,服务器根据参数权值,对每个第一搜索结果的各个后验参数进行加权求和处理,得到每个第一搜索结果的评价系数。

在步骤S301服务器得到每一个后验参数对应的参数权值后,则可以利用得到的参数权值,对通过历史点击模型得到的每个第一搜索结果的各个后验参数进行加权求和处理,从而得到每一个搜索结果的评价系数。例如,本实施例针对的第一搜索结果可以是针对某一类由同样搜索词得到的视频的搜索结果,其采用的后验参数可以是用户针对搜索得到的视频的点击率、点赞率、关注率以及某个视频的播放时长,因此,其搜索得到的每一个视频的评价系数可以通过如下关系模型进行计算:

ue=α×ctr+β×ltr+γ×ftr+δ×avg_play_time

其中,ctr表示针对搜索得到的某个视频的点击率,ltr代表针对该视频的点赞率,ftr即是该视频的关注率,而avg_play_time则表示多个用户对该视频的平均播放时长,α、β、γ、δ则分别表示点击率、点赞率、关注率以及平均播放时长对应的参数权值,ue即表示某一个搜索得到的视频的评价系数。

在步骤S303中,服务器将每个第一搜索结果的评价系数的平均值,作为第一搜索结果对应的第一评价信息。

最后,服务器可以将步骤S302中计算得到的每一个第一搜索结果的评价系数进行求平均处理,将得到的平均值作为通过历史点击模型得到的样本搜索词的搜索结果的第一评价信息。

在上述例子中,在得到每一个搜索得到的视频的评价系数ue后,可以采用如下关系模型计算第一评价信息:

其中,ue

同理,服务器也可以采集由新增点击模型得到的第二搜索结果的后验数据,每一个后验数据也可以采集与第一搜索结果对应的后验参数,并设置与第一搜索结果相同的参数权值,再通过参数权值对每个第二搜索结果的后验参数进行加权求和,并求平均,从而可以得到通过新增点击模型得到的样本搜索词的搜索结果的第二评价信息。

本实施例通过对多个搜索结果对应的不同参数类型的后验参数设置相应的参数权值,并利用参数权值得到每一个搜索结果的评价系数,并将多个搜索结果的评价系数的平均值作为最终的评价信息,可以提高得到的最终的评价信息的准确性。

在一示例性实施例中,步骤S103可以进一步包括:若第二评价信息大于第一评价信息,服务器则将新增点击模型作为样本搜索词的有效点击模型;第一评价信息用于表征针对于第一搜索结果的用户满意程度;第二评价信息用于表征针对于第二搜索结果的用户满意程度。

本实施例中,针对于搜索结果的评价信息可以用于表征用户针对于搜索结果的满意程度,由于上述评价信息时通过用户的后验数据得到,一般而言,后验数据越大,则表明用户的满意程度越高,因此,如果通过新增点击模型得到的第二搜索结果的第二评价信息,大于通过历史点击模型得到的第一搜索结果的第一评价信息,即可表明用户对新增点击模型得到的第二搜索结果的满意程度更高,因此服务器可以将新增点击模型作为该样本搜索词的有效点击模型。同理,如果得到的针对于第一搜索结果的第一评价信息大于第二评价信息,则表明用户对历史点击模型得到的第一搜索结果的满意程度更高,那么服务器则可以将历史点击模型仍然作为该样本搜索词的有效点击模型。

本实施例中,服务器可通过比对第一评价信息以及第二评价信息的大小关系,确定样本搜索词的有效点击模型,可以保证有效点击模型可以是用户满意程度最高的点击模型,从而提高用户针对点击模型输出的搜索结果的满意程度。

在一示例性实施例中,如图5所示,步骤S103之后,还可以包括:

在步骤S501中,服务器获取当前点击模型的当前搜索词个数;当前点击模型为有效点击模型中的任一点击模型。

由于随着新的点击模型不断加入服务器,对于服务器中存储的旧的点击模型所对应的搜索词会不断减少,例如某个点击模型A加入服务器时其对应的搜索词包括搜索词A,搜索词B以及搜索词C,而在新的点击模型B加入服务器后,由于新的点击模型针对搜索词B以及搜索词C具有更好的搜索质量,因此点击模型A对应的搜索词则会只剩下搜索词A,同时随着新的点击模型不断加入,为了避免服务器的容量不断扩大,需要对服务器中的点击模型进行删除。

具体来说,当服务器确定每一个样本搜索词分别对应的有效点击模型后,服务器可以从其存储的有效点击模型中,提取出任意一个有效点击模型,作为当前点击模型,而当前搜索词个数则指的是当前点击模型中仍然生效的搜索词个数,服务器在得到当前点击模型后可以同时获取该当前点击模型仍然生效的搜索词,作为当前搜索词,并对当前搜索词的个数进行统计,从而得到当前点击模型对应的当前搜索词个数。

在步骤S502中,若当前搜索词个数满足删除条件,服务器将当前点击模型进行删除处理。

之后,服务器可以判断当前点击模型还生效的当前搜索词的个数是否达到了预先设定的对点击模型进行删除的删除条件,如果已经满足了删除条件,那么服务器则会将当前点击模型进行删除。

本实施例中,服务器可以统计历史点击模型和新增点击模型中的任一当前点击模型对应的当前搜索词个数,如果当前搜索词个数满足删除条件,则可以将当前点击模型从服务器中删除,从而可以减少点击模型占用的服务器容量,可以保证服务器的简约。

进一步地,如图6所示,步骤S502可以进一步包括:

在步骤S601中,服务器获取当前点击模型对应的初始搜索词个数。

其中,初始搜索词个数指的是当前点击模型加入服务器时生效的搜索词个数。例如:由于某个点击模型A加入服务器时其对应的搜索词包括搜索词A,搜索词B以及搜索词C,因此点击模型A对应的初始搜索词个数即为3个。具体来说,服务器在将点击模型新加入时,在确定新加入的点击模型对应的搜索词的同时,还可以统计其对应的搜索词的搜索词个数,作为初始搜索词个数。

在步骤S602中,服务器确定当前搜索词个数与初始搜索词个数的比例;

在步骤S603中,若比例小于预设的比例阈值,服务器将当前点击模型进行删除处理。

当前搜索词个数则指的是当前点击模型在当前时刻生效的搜索词个数,在上述例子中,由于点击模型A对应的搜索词则最后只剩下搜索词A,因此点击模型A对应的当前搜索词个数即为1个,服务器则可以确定点击模型A的当前搜索词个数与初始搜索词个数的比例为1/3。服务器确定该比例后,则可以将得到的比例与预先设定的比例阈值进行比较,该比例阈值可以是用户预先设定,例如可以是10%,即当前搜索词个数降低至初始搜索词个数的10%时,服务器即可将当前点击模型进行删除处理。

本实施例中,当前点击模型的删除条件是根据当前搜索词个数与初始搜索词个数的比例决定,可以保证不同的点击模型可以具有统一的删除条件,从而保证对当前点击模型进行删除处理的泛用性。

另外,步骤S502还可以包括:若当前搜索词个数小于预设的搜索词个数阈值,服务器将当前点击模型进行删除处理。

而如果某个当前点击模型在加入服务器时生效的初始搜索词个数本来就较少时,例如点击模型B生效的初始搜索词只有一个时,这个点击模型B实际发挥的作用较小,并且还会占用服务器的容量,因此对于服务器中的点击模型,用户还可以对其设置搜索词个数阈值,例如设置为10,在点击模型的当前搜索词个数小于10时,即可对其进行删除处理,从而可进一步减少服务器消耗的存储容量。

而对于本身生效搜索词个数较少的点击模型,本实施例也可以不采取将比例作为删除条件,而直接采取将当前生效的搜索词个数作为删除条件,对于生效搜索词个数较少的点击模型可以直接进行删除,从而进一步减少点击模型占用的服务器容量。

图7是根据一示例性实施例示出的一种搜索方法的流程图,如图7所示,搜索方法用于服务器中,包括以下步骤。

在步骤S701中,服务器获取搜索词信息,以及获取与搜索词信息匹配的有效点击模型;有效点击模型由如上任一项实施例所述的点击模型确定方法所确定。

其中,搜索词信息指的是用户需要通过服务器进行搜索时输入的搜索词条信息,由于在点击模型确定方法中,每次在新增点击模型加入服务器时,都建立有与其对应的样本搜索词,因此服务器中已经预先建立有多种搜索词与点击模型之间的对应关系。当服务器接收到搜索词信息时,则可以根据上述搜索词与点击模型之间的对应关系,找到与搜索词信息对应的有效点击模型。

在步骤S702中,服务器将搜索词信息输入有效点击模型,通过有效点击模型输出搜索词信息对应的搜索结果。

在步骤S701服务器得到搜索词信息对应的有效点击模型后,即可将搜索词信息输入有效点击模型,由有效点击模型输出搜索词信息对应的搜索结果,并将各个搜索结果按照点击模型对应的搜索策略进行排序,并将排序后的搜索结果返回至用户进行展示。

上述搜索方法中,服务器获取搜索词信息,以及获取与搜索词信息匹配的有效点击模型;有效点击模型由如上任一项实施例所述的点击模型确定方法所确定;将搜索词信息输入有效点击模型,通过有效点击模型输出搜索词信息对应的搜索结果。本公开通过预先建立搜索词与点击模型之间的对应关系,在用户需要进行搜索录入搜索词时,即可得到与录入的搜索词信息匹配的有效点击模型,得到搜索结果。由于服务器中预先存储有多种点击模型,并且有效点击模型是基于该搜索词信息的搜索结果对应的评价信息得到,因此本公开提供的搜索方法实现了针对不同搜索词可以采用不同的点击模型进行搜索,并且可以利用评价系数最大的点击模型执行搜索,从而提高了得到的搜索结果的搜索质量。

在一示例性实施例中,还提供了一种搜索场景下后验数据的点击调权方法,该方法可以应用于视频搜索系统,通过采集用户针对搜索系统得到的每一个视频的点击率ctr、长播率lvtr、关注率ftr以及点赞率ltr等后验数据,选择最佳的点击模型实现搜索,该方案具体可以包括如下步骤:

(1)搜索系统预先由多个点击模型组成,不同的点击模型对应于不同的搜索策略,不同的搜索策略用于对需要得到的搜索结果进行不同方式的重新排序,并且将此时的搜索系统的系统状态设置为status

(2)在一个新的点击模型加入搜索系统时,需要对该点击模型输出的搜索结果进行测试,其中测试使用的搜索词可以是所有的搜索词,此时加入新的点击模型后搜索系统的系统状态可以设置为status

(3)比对status

(4)使用用户满意度模型,计算status

步骤1:用户满意度模型可以设置为若干后验数据的组合,例如:

ue=α×ctr+β×ltr+γ×ftr+δ×avg_play_time

其中ctr为点击率,ltr为点赞率、ftr为关注率,avg_play_time为平均播放时间。

步骤2:一个搜索词下会有N个视频的消费行为,因此可以对这个N个视频的满意度求平均:

(5)通过

(6)将set

另外,随着时间的推移,靠前的点击模型的搜索策略对应的搜索词会逐渐减少,为了保证系统的简约,还提供了一个点击模型的退场机制。

(1)在任意时刻t,搜索系统的状态为status

(2)统计当前还在生效的搜索词比例

(3)如果ratio小于一定比例θ,例如10%,则将点击模型策略k下掉。

上述实施例,通过多种点击模型的策略的组合,达到仅改善搜索词的后验效果变好的部分,并去除掉后验效果变坏部分的影响,实现了对点击模型进行局部精确改善。并且,还可以通过点击模型的退场,保证搜索系统的简约。

图8是根据一示例性实施例示出的一种点击模型确定装置的框图。参照图8,该装置包括搜索结果获取单元801,评价信息确定单元802和点击模型确定单元803。

搜索结果获取单元801,被配置为执行通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;

评价信息确定单元802,被配置为执行确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;

点击模型确定单元803,被配置为执行根据第一评价信息和第二评价信息,确定样本搜索词的有效点击模型。

在一示例性实施例中,评价信息确定单元802,进一步被配置为执行获取针对于第一搜索结果的后验数据;根据后验数据确定第一搜索结果对应的第一评价信息。

在一示例性实施例中,第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;评价信息确定单元802,进一步被配置为执行获取每个第一搜索结果对应的各个后验参数的参数权值;根据参数权值,对每个第一搜索结果的各个后验参数进行加权求和处理,得到每个第一搜索结果的评价系数;将每个第一搜索结果的评价系数的平均值,作为第一搜索结果对应的第一评价信息。

在一示例性实施例中,点击模型确定单元803,进一步被配置为执行若第二评价信息大于第一评价信息,则将新增点击模型作为样本搜索词的有效点击模型;第一评价信息用于表征针对于第一搜索结果的用户满意程度;第二评价信息用于表征针对于第二搜索结果的用户满意程度。

在一示例性实施例中,点击模型确定装置,还包括:点击模型删除单元,被配置为执行获取当前点击模型的当前搜索词个数;当前点击模型为有效点击模型中的任一点击模型;若当前搜索词个数满足删除条件,将当前点击模型进行删除处理。

在一示例性实施例中,点击模型删除单元,进一步被配置为执行获取当前点击模型对应的初始搜索词个数;确定当前搜索词个数与初始搜索词个数的比例;若比例小于预设的比例阈值,将当前点击模型进行删除处理。

在一示例性实施例中,点击模型删除单元,进一步被配置为执行若当前搜索词个数小于预设的搜索词个数阈值,将当前点击模型进行删除处理。

图9是根据一示例性实施例示出的一种搜索装置的框图。参照图9,该装置包括点击模型获取单元901和搜索结果输出单元902。

点击模型获取单元901,被配置为执行获取搜索词信息,以及获取与搜索词信息匹配的有效点击模型;有效点击模型由如上任一项实施例所述的点击模型确定方法所确定;

搜索结果输出单元902,被配置为执行将搜索词信息输入有效点击模型,通过有效点击模型输出搜索词信息对应的搜索结果。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图10是根据一示例性实施例示出的一种用于点击模型确定或者用于搜索的设备1000的框图。例如,设备1000可以为一服务器。参照图10,设备1000包括处理组件1020,其进一步包括一个或多个处理器,以及由存储器1022所代表的存储器资源,用于存储可由处理组件1020的执行的指令,例如应用程序。存储器1022中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1020被配置为执行指令,以执行上述点击模型确定或者搜索的方法。

设备1000还可以包括一个电源组件1024被配置为执行设备1000的电源管理,一个有线或无线网络接口1026被配置为将设备1000连接到网络,和一个输入输出(I/O)接口1028。设备1000可以操作基于存储在存储器1022的操作系统,例如Windows Server,Mac OSX,Unix,Linux,FreeBSD或类似。

在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器1022,上述指令可由设备1000的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质,例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如上任一项实施例所述的点击模型确定方法或者如上任一项实施例所述的搜索方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号