首页> 中国专利> 一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统

一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统

摘要

本发明公开了一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统,包括计算机,所述计算机内设有关键词搜索模块,所述关键词搜索模块连接有动态搜索建议模块,所述动态搜索建议模块连接有自定义商业因素搜索模块,所述自定义商业因素搜索模块与所述动态搜索建议模块连接,所述自定义商业因素搜索模块连接有热点数据生成模块、搜索建议基础数据模块以及商业运营数据模块,所述热点数据生成模块、搜索建议基础数据模块以及商业运营数据模块均连接有数据整合处理模块,所述数据整合处理模块连接有搜索建议索引模块。本发明结构设计合理,保证搜索建议基础服务,提供基础的拼写检查搜索建议功能。

著录项

  • 公开/公告号CN113190739A

    专利类型发明专利

  • 公开/公告日2021-07-30

    原文格式PDF

  • 申请/专利权人 北京比特易湃信息技术有限公司;

    申请/专利号CN202110142612.4

  • 发明设计人 朱晓强;

    申请日2021-02-02

  • 分类号G06F16/9532(20190101);G06F16/951(20190101);G06F16/9032(20190101);G06F40/232(20200101);

  • 代理机构11740 北京棘龙知识产权代理有限公司;

  • 代理人李改平

  • 地址 100089 北京市海淀区西直门外大街168号腾达大厦03层17号

  • 入库时间 2023-06-19 12:02:28

说明书

技术领域

本发明涉及一种用户搜索查询建议和拼写检查的系统,具体是一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统,属于用户搜索查询建议应用技术领域。

背景技术

用户会在网站,手机App上进行内容搜索,Suggest是交互性很强的产品,随着用户的输入,呈现不同的内容。在用户输入内容后,推荐出来的内容尽可能的贴近用户需求;如何在用户输入搜索内容后,能精准,智能,带有引导性的推荐内容提示。

热点数据会比较局限,需要依赖于用户的一段时间的搜索内容进行统计,但是热度时间范围无法界定,而且持续范围也无法预估,且在使用方案二来匹配用户搜索内容时,根据搜索词和搜索建议内容的相关性匹配,对搜索建议内容依赖很强,脏数据影响词的匹配概率,同时使用方案三的根据前两种方案相结合,来进行搜索建议匹配,机器推荐技术门槛高,训练学习复杂。因此,针对上述问题提出一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统。

发明内容

本发明的目的就在于为了解决上述问题而提供一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统。

本发明通过以下技术方案来实现上述目的,一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统,包括计算机,所述计算机内设有关键词搜索模块,所述关键词搜索模块连接有动态搜索建议模块,所述动态搜索建议模块连接有自定义商业因素搜索模块,所述自定义商业因素搜索模块与所述动态搜索建议模块连接,所述自定义商业因素搜索模块连接有热点数据生成模块、搜索建议基础数据模块以及商业运营数据模块,所述热点数据生成模块、搜索建议基础数据模块以及商业运营数据模块均连接有数据整合处理模块,所述数据整合处理模块连接有搜索建议索引模块。

优选的,所述关键词搜索模块包括搜索次数统计模块以及电机数据统计模块,所述搜索次数统计模块以及电机数据统计模块均与动态搜索建议模块单向连接。

优选的,所述数据整合处理模块包括重复词搜索模块、之前时间段运营词统计模块和未来时间段运营词统计模块,所述重复词搜索模块、之前时间段运营词统计模块和未来时间段运营词统计模块均单向连接至搜索建议索引模块。

优选的,所述重复词搜索模块包括之前和当前重复词统计模块和未来和当前重复词统计模块,所述之前和当前重复词统计模块和未来和当前重复词统计模块均单向连接至搜索建议索引模块。

优选的,所述数据整合处理模块与搜索建议索引模块单向连接。

优选的,所述动态搜索建议模块单向连接至动态搜索建议模块,所述动态搜索建议模块单向连接至关键词搜索模块。

优选的,所述动态搜索建议模块、自定义商业因素搜索模块、动态搜索建议模块连接以及所述动态搜索建议模块四者依次单向连接。

优选的,所述自定义商业因素搜索模块均分别单向连接至热点数据生成模块、搜索建议基础数据模块以及商业运营数据模块。

优选的,所述关键词搜索模块单向连接至动态搜索建议模块。

优选的,所述热点数据生成模块、搜索建议基础数据模块以及商业运营数据模块分别单向连接至数据整合处理模块。

本发明的有益效果是:本发明结构设计合理,保证搜索建议基础服务,提供基础的拼写检查搜索建议功能,完整的保留了基础功能;在保证基础服务的同时,利用搜索引擎的搜索建议功能,增加自定义商业因素;增加商业因素可以与业务的广告,推广,运营等多个业务联动,影响引导用户完成商业运营;可以追踪效果,根据追踪数据进一步正向优化自定义商业因素权重,保证商业价值最大化。

附图说明

图1为本发明整体结构示意图;

图2为本发明热点数据生成流程图;

图3为本发明搜索建议查询流程图。

图中:1、关键词搜索模块,101、搜索次数统计模块,102、点击数据统计模块,2、动态搜索建议模块,3、搜索建议查询模块,4、自定义商业因素搜索模块,5、热点数据生成模块,6、搜索建议基础数据模块,7、商业运营数据模块,8、数据整合处理模块,801、重复词搜索模块,8011、之前和当前重复词统计模块,8012、未来和当前重复词统计模块,802、之前时间段运营词统计模块,803、未来时间段运营词统计模块,9、搜索建议索引模块,10、计算机。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-3所示,一种自定义商业因素的适用于用户搜索查询建议和拼写检查的系统,包括计算机10,所述计算机10内设有关键词搜索模块1,所述关键词搜索模块1连接有动态搜索建议模块2,所述动态搜索建议模块2连接有自定义商业因素搜索模块4,所述自定义商业因素搜索模块4与所述动态搜索建议模块3连接,所述自定义商业因素搜索模块4连接有热点数据生成模块5、搜索建议基础数据模块6以及商业运营数据模块7,所述热点数据生成模块5、搜索建议基础数据模块6以及商业运营数据模块7均连接有数据整合处理模块8,所述数据整合处理模块8连接有搜索建议索引模块9。

优选的,所述关键词搜索模块1包括搜索次数统计模块101以及电机数据统计模块102,所述搜索次数统计模块101以及电机数据统计模块102均与动态搜索建议模块2单向连接。

优选的,所述数据整合处理模块8包括重复词搜索模块801、之前时间段运营词统计模块802和未来时间段运营词统计模块803,所述重复词搜索模块801、之前时间段运营词统计模块802和未来时间段运营词统计模块803均单向连接至搜索建议索引模块9。

优选的,所述重复词搜索模块801包括之前和当前重复词统计模块8011和未来和当前重复词统计模块8012,所述之前和当前重复词统计模块8011和未来和当前重复词统计模块8012均单向连接至搜索建议索引模块9。

优选的,所述数据整合处理模块8与搜索建议索引模块9单向连接。

优选的,所述动态搜索建议模块3单向连接至动态搜索建议模块2,所述动态搜索建议模块2单向连接至关键词搜索模块1。

优选的,所述动态搜索建议模块2、自定义商业因素搜索模块4、动态搜索建议模块3连接以及所述动态搜索建议模块2四者依次单向连接。

优选的,所述自定义商业因素搜索模块4均分别单向连接至热点数据生成模块5、搜索建议基础数据模块6以及商业运营数据模块7。

优选的,所述关键词搜索模块1单向连接至动态搜索建议模块2。

优选的,所述热点数据生成模块5、搜索建议基础数据模块6以及商业运营数据模块7分别单向连接至数据整合处理模块8。

本发明在使用时,包括如下步骤:

一、数据整合,

1.通过热点数据生成模块5进行热点数据生成,

热点数据包括2部分数据,一部分是商业运营自定义的热词,另一部分也是主要数据,是根据一段时间内用户的搜索词数据,首选通过搜索次数过滤大部分数据,当搜索次数大于阈值,直接可以定义为热点数据,当搜索次数小于阈值时,通过返回结果的点击数据次数阈值来判读是否划分为热点词。

2.通过商业运营数据模块7进行商业运营词生成,

根据业务自定义商业运营数据,可以多维度进行划分,可以对接各业务,比如广告数据,根据不同广告类型提取广告竞价关键词,经销商运营词,可以根据业务推广来增加推广词等。

3.通过搜索建议基础数据模块6进行搜索建议基础数据,根据搜索建议的数据源,提取数据,

提取数据是需要进行数据清洗,把不符合要求的数据进行过滤,尽可能的保证基础数据的准确性。为自然搜索保证相关性。

4.权重比例归一化处理,

根据自定义的商业因素,根据数据比例来实现搜索权重因子的归一化处理。归一化各权重比例可以动态调整,如需调整,需要重新生成索引数据。

二、通过搜索建议索引模块生成搜索建议索引,

归一化后的各种商业因素因子和搜索建议基础数据,根据索引定义生成对应的索引,便于查询。索引分为3个索引,分别是热点数据索引,搜索基础数据索引,商业运行数据索引。

三、通过搜索建议查询模块来进行搜索建议查询,

1、自然搜索,

根据用户搜索词,分别去3个索引进行自然搜索,根据自定义3种数据的比例进行自然排序结果组合。比如自然搜索中,热词、搜索建议基础词、商业运营词按照2:5:3的比例进行组合。那么如果返回给用户需要20条数据,那么需要热词索引搜索结果返回4条数据,商业运营词返回6条数据,搜索建议基础词返回10条数据。

2、自定义因素二次排序,

根据上一步自然搜索结果,对每条数据进行二次打分并排序,根据用户自定义商业因子权重,对3中数据进行二次排序打分,再按照分数进行二次排序。等到最后得返回结果顺序。排序后直接返回给用户即可。

四、返回给用户,追踪效果,

搜索建议的结果返回给用户,需要进行数据跟踪,为每条返回结果定义唯一的ID,来追踪用户的点击行为。根据用户的点击行为,来进一步分析系统返回结果的质量。是否满足了用户的意图;或者是对用户提供的正确的引导。正确引导的评判标准有,浏览时间,转化率等。

其中:

自定义商业因素:根据业务场景,业务范围,不同时间,自定义搜索建议因素,影响数据索引的生成和检索过程中各因素的比例,从而影响返回结果的排序展示。

数据整合:根据自定义商业因素生成搜索查询用索引数据。

搜索建议查询:根据自然搜索建议查询结果,结合自定义商业因素,对返回结果进行二次打分后排序,把新的结果进行返回。

热点数据:获取一段时间内的热点数据,根据当前业务运营范围划定获取数据的时间范围。

商业运营数据:当前一段时间业务运营的数据划分3个阶段,以当前时间点起点,向前划分一个时间段来表示之前的运营数据,根据当前时间点划分一个阶段来表示当前运营数据,向后划分一个时间段表示未来要运营的数据。

当前时间段:如当前时间点,前后加减7天。

之前时间段:如上图当前时间段之前15天。

未来时间段:如上图当前时间段之后15天。

时间段的划分可以根据不同的业务进行划分,也可以按其他维度进行划分,具体业务具体分析。

划分时间维度,是为了对运营词进行数据整合,根据不同维度设定不同的权重。运营词可以根据时间段和是否重复划分不同的权重,根据具体业务具体定义分析。比如,3个时间都有重复的词,可理解为是一直商业运营的词,权重最大,与之前重复的词,是运营过去时,权重比较低,与未来重复的词,表示未来要推广运营的,权重介于2者之间。可以根据不同业务场景具体分析。

搜索建议基础数据:通过一定的规则进行数据清洗,清洗后的数据进行提取。

搜索建议基础数据,是动态的,是一段时间内的内容数据,比如新闻、视频、问答、动态等各类数据。内容质量参差不齐,需要进行脏数据清洗。保留优质内容。数据清洗处理方法非常多,比如:内容长度判断、禁搜词判断、内容的表现情况(浏览量、回复数、点击数等各项评判指标)判断等。

权重比例归一化处理:根据自定义商业因素的比重,在搜索建议基础数据基础上,进行权重归一化处理。

各维度初始化分数不同,再数据归一化处理时,根据实际情况采用不同的算法,比如:线性比例变化法、极差变化法、均值标准化等。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的得同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号