首页> 中国专利> 信息导航的实现方法、信息导航服务器和信息处理系统

信息导航的实现方法、信息导航服务器和信息处理系统

摘要

本申请实施例公开了一种信息导航的实现方法,包括:信息导航服务器获得客户端提供的查询信息;所述信息导航服务器通过模式提取算法对所述查询信息进行分析,得到至少一个模式;所述信息导航服务器如果得到多个模式,则计算每个模式的相似度;所述信息导航服务器按照相似度高低的顺序,对所有的模式进行排序;所述信息导航服务器按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息;所述信息导航服务器将查找到的导航信息发送给客户端。本申请实施例解决了信息导航服务器无法为客户端提供与映射表中不存在的查询信息对应的导航信息。

著录项

  • 公开/公告号CN102193939A

    专利类型发明专利

  • 公开/公告日2011-09-21

    原文格式PDF

  • 申请/专利权人 阿里巴巴集团控股有限公司;

    申请/专利号CN201010123209.9

  • 发明设计人 廖剑;林锋;张寿松;张勤;

    申请日2010-03-10

  • 分类号G06F17/30;

  • 代理机构北京集佳知识产权代理有限公司;

  • 代理人逯长明

  • 地址 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱

  • 入库时间 2023-12-18 03:13:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-04-06

    授权

    授权

  • 2011-11-23

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20100310

    实质审查的生效

  • 2011-09-21

    公开

    公开

说明书

技术领域

本申请涉及信息处理技术,尤其涉及信息导航(Guided Search)的实现方法、信息导航服务器和信息处理系统。

背景技术

在信息处理领域中,经常会出现这样的情形,即:用户在客户端输入文字,希望得到与输入的文字相关的信息,信息导航服务器获得客户端提供的文字后,对文字进行分析,识别用户的查询意图,向客户端提供与用户输入的文字相关的信息,缩小用户的查询范围,以使用户尽快找到需要的信息。

目前,信息导航服务器一般会预先存储查询信息与导航信息之间映射关系的映射表。查询信息例如是用户在客户端输入的文字,导航信息例如是与用户输入的文字相关的信息。信息导航服务器获得查询信息后,在映射表中查找与查询信息对应的导航信息,如果在映射表中查找到与查询信息对应的导航信息,则将查找到的导航信息发送给客户端。

在对现有技术的研究和实践过程中,发明人发现现有技术中存在以下问题:在上述的信息导航技术中,只有在用户输入的查询信息与上述映射表中的查询信息完全一致的情况下,信息导航服务器才会在上述映射表中查找到与用户输入的查询信息对应的导航信息,并将查找到的导航信息发送给客户端。如果用户输入的查询信息与上述映射表中的任何一个查询信息都不一致,那么信息导航服务器在上述映射表中无法查找到与用户输入的查询信息对应的导航信息,当然也不会向客户端发送导航信息。所以,在现有的信息导航技术中,信息导航服务器无法为客户端提供与映射表中不存在的查询信息对应的导航信息。

发明内容

本申请实施例的目的是提供信息导航的实现方法、信息导航服务器和信息处理系统,用以解决信息导航服务器无法为客户端提供与映射表中不存在的查询信息对应的导航信息。

为解决上述技术问题,本申请实施例提供了一种信息导航的实现方法,适用于包括信息导航服务器的信息处理系统,所述信息导航服务器用于根据客户端发送的查询信息查询导航信息,所述信息导航服务器存储有记录查询信息与导航信息之间映射关系的映射表,所述方法是这样实现的:信息导航服务器获得客户端提供的查询信息;所述信息导航服务器通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;所述信息导航服务器如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;所述信息导航服务器按照相似度高低的顺序,对所有的模式进行排序;所述信息导航服务器按照所述排序,将模式作为关键词,在所述映射表中查找与模式对应的导航信息;所述信息导航服务器将查找到的导航信息发送给客户端。

为解决上述技术问题,本申请实施例还提供了一种信息导航服务器,适用于包括信息导航服务器的信息处理系统,所述信息导航服务器用于根据客户端发送的查询信息查询导航信息,所述信息导航服务器包括:存储单元,用于存储记录查询信息与导航信息之间映射关系的映射表;获得单元,用于获得客户端提供的查询信息;分析单元,用于通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;计算单元,用于在所述分析单元得到多个模式时,计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;排序单元,用于按照相似度高低的顺序,对所有的模式进行排序;查找单元,用于按照所述排序,将模式作为关键词,在所述映射表中查找与模式对应的导航信息;发送单元,用于将查找到的导航信息发送给客户端。

为解决上述技术问题,本申请实施例还提供了一种信息处理系统,包括信息导航服务器;所述信息导航服务器用于:获得客户端提供的查询信息;通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;按照相似度高低的顺序,对所有的模式进行排序;按照所述排序,将模式作为关键词,在所述映射表中查找与模式对应的导航信息,将查找到的导航信息发送给客户端。

为解决上述技术问题,本申请实施例还提供了一种信息导航的实现方法,适用于包括信息导航服务器的信息处理系统,所述信息导航服务器用于根据客户端发送的查询信息查询导航信息,所述信息导航服务器存储有记录查询信息与导航信息之间映射关系的映射表,所述方法包括:信息导航服务器获得客户端提供的查询信息;所述信息导航服务器使用方式(1)查找与所述查询信息对应的导航信息,并采用机器学习方式预测到与所述查询信息对应的导航信息;所述信息导航服务器如果使用方式(1)查找到与所述查询信息对应的导航信息,则根据两种方式得到的导航信息,确定提供给客户端的导航信息,并将确定提供给客户端的导航信息发送给客户端;其中,所述方式(1)包括:所述信息导航服务器通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;所述信息导航服务器如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;所述信息导航服务器按照相似度高低的顺序,对所有的模式进行排序;所述信息导航服务器按照所述排序,将模式作为关键词,在所述映射表中查找与模式对应的导航信息。

为解决上述技术问题,本申请实施例还提供了一种信息导航服务器,适用于包括信息导航服务器的信息处理系统,所述信息导航服务器用于根据客户端发送的查询信息查询导航信息,所述信息导航服务器包括:存储单元,用于存储记录查询信息与导航信息之间映射关系的映射表;获得单元,用于获得客户端提供的查询信息;第一查找单元,用于使用方式(1)查找与所述查询信息对应的导航信息;第二查找单元,采用机器学习方式预测到与所述查询信息对应的导航信息;导航信息确定单元,用于如果所述第一查找单元使用方式(1)查找到与所述查询信息对应的导航信息,则根据所述第一查找单元得到的导航信息和所述第二查找单元得到的导航信息,确定提供给客户端的导航信息;发送单元,用于将确定提供给客户端的导航信息发送给客户端;所述方式(1)包括:通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;按照相似度高低的顺序,对所有的模式进行排序;按照所述排序,将模式作为关键词,在所述映射表中查找与模式对应的导航信息。

为解决上述技术问题,本申请实施例还提供了一种信息处理系统,包括:客户端及信息导航服务器;所述客户端用于与所述信息导航服务器交互信息;所述信息导航服务器用于获得客户端提供的查询信息,使用方式(1)查找与所述查询信息对应的导航信息,并采用机器学习方式预测到与所述查询信息对应的导航信息,如果使用方式(1)查找到与所述查询信息对应的导航信息,则根据所述方式(1)和机器学习方式两种方式得到的导航信息,确定提供给客户端的导航信息,并将确定提供给客户端的导航信息发送给客户端;所述方式(1)包括:通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;按照相似度高低的顺序,对所有的模式进行排序;按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息。

可见,本申请实施例中,信息导航服务器在获得客户端提供的查询信息后,可以通过模式提取算法对所述查询信息进行分析,得到至少一个模式,如果得到多个模式,则计算每个模式的相似度,按照相似度高低的顺序,对所有的模式进行排序,再按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息。这种情况下,即使从客户端获得的查询信息在映射表中不存在,那么由于模式可能会在映射表中存在,所以也有可能查找到合适的导航信息,解决了信息导航服务器无法为客户端提供与映射表中不存在的查询信息对应的导航信息。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例应用的网络环境示意图;

图2为本申请实施例的一种信息导航的实现方法的流程图;

图3为本申请实施例的一种信息导航服务器的逻辑结构示意图;

图4为本申请实施例的另一种信息导航的实现方法的流程图;

图5为本申请实施例的另一种信息导航服务器的逻辑结构示意图。

具体实施方式

本申请实施例提供一种信息导航的实现方法、信息导航服务器和信息处理系统。

在介绍信息导航的实现方法、信息导航服务器和信息处理系统之前,首先介绍本申请实施例应用的网络环境和涉及的一些专业知识。

本申请实施例应用的网络环境如图1所示。客户端102与具有信息导航功能的信息导航服务器101之间可以交互信息。客户端102可以将用户输入的查询信息发给信息导航服务器101,信息导航服务器101根据查询信息查找对应的导航信息,如果找到对应的导航信息,则将查找到的导航信息发送给客户端102,客户端102向用户展示导航信息。

查询信息可以是指用户在客户端输入的需要查询的信息。查询信息可以包括文字、数字、符号、字母等元素。在实际应用中,查询信息例如是产品的名称、型号等信息。

导航信息可以是指具有导航作用的信息,便于用户快速的找到需要的信息。导航信息也可以包括文字、数字、符号、字母等元素。在实际应用中,导航信息例如是产品所属的类目等信息。例如,如果查询信息是“Nokia N95”(产品的型号),那么导航信息可以是“手机”(类目)。

在实际应用中,一个查询信息可以只对应一个导航信息,例如,“NokiaN95”可以只对应“手机”这个类目;一个查询信息也可以对应多个导航信息,例如,“Nokia N95”可以对应“手机”、“电子产品”等多个类目;多个查询信息可以对应同一个导航信息,例如,“Nokia N95”和“Moto A1800”都可以对应“手机”这个类目。

本申请的所有实施例都适用于包括信息导航服务器的信息处理系统,信息导航服务器用于根据客户端发送的查询信息查询导航信息,信息导航服务器存储有记录查询信息与导航信息之间映射关系的映射表。

下面对本申请实施例的一种信息导航的实现方法进行说明。如图2所示,这种方法包括:

S201:信息导航服务器获得客户端提供的查询信息。

用户在客户端输入查询信息,客户端可以将查询信息发送给信息导航服务器,这样,信息导航服务器就获得了客户端提供的查询信息。

S202:所述信息导航服务器通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息。

模式提取算法包括对查询信息进行分析的步骤、信息提取的规则等。模式提取算法通常会结合自然语言处理技术,例如句法分析、长度为N的短语(N-Gram)、丢词短语(Skip-Gram)(来源于rouge评测标准)等。模式提取算法可以预先存储在信息导航服务器中。信息导航服务器获得查询信息后,可以查找预先存储的模式提取算法,并根据模式提取算法对查询信息进行分析。

信息导航服务器对查询信息进行分析,主要是获得至少一个模式。模式可以是指从查询信息中提取的信息,模式可以用于表征查询信息,合适的模式可以不失去查询信息的语义,或者尽量不失去查询信息的语义。模式可以是查询信息的组成部分,例如,假设查询信息是“car mp3 player with fm transmitter911”,那么模式可以是“car mp3 player”、“car player”。模式也可以是由查询信息转换过来的信息,例如,假设查询信息是“Nokia N95”,那么模式可以是“诺基亚手机”。

在实际应用中,模式提取算法可以根据实际需要而包括不同的信息,这种情况下,信息导航服务器可以按照多种方式对查询信息进行分析,得到至少一个模式。

例如,如果模式提取算法指明可以从查询信息中提取出中心词和/或中心短语,那么信息导航服务器在对查询信息进行分析时,就需要提取出中心词和/或中心短语作为查询信息的模式。中心词是表征查询信息的基本含义的词,中心短语是表征查询信息的基本含义的短语。以查询信息“car mp3 player withfm transmitter 911”为例,信息导航服务器可以从这个查询信息中提取出中心词为“player”,提取出中心短语为“mp3 player”,当然,提取出的中心短语也可以是“car mp3 player”,一般来说,提取的中心词的数量是一个,提取的中心短语的数量也是一个。

例如,如果模式提取算法指明可以从查询信息中提取出指定长度的短语作为查询信息的模式,那么信息导航服务器在对查询信息进行分析时,就需要提取出指定长度的短语。短语的长度是指短语包括的词的数量。具体的,信息导航服务器可以通过丢词的方式提取指定长度的短语,在丢词过程中,所丢词的位置可以不相邻。例如,以查询信息“car mp3 player with fm transmitter 911”为例,信息导航服务器可以连续丢掉“with”、“fm”、“transmitter”、“911”,提取出“car mp3 player”作为模式,信息导航服务器也可以分别丢掉“fm”和“911”,提取出“car mp3 player with transmitter”。

一般来说,提取出的短语都包括中心词或中心短语,所以,提取出的指定长度的短语可以包括中心词或中心短语。以查询信息“car mp3 player with fmtransmitter 911”为例,假设中心词是“player”,信息导航服务器可以从这个查询信息中提取出长度为2的短语,长度为2的短语例如是“mp3 player”等短语,信息导航服务器也可以从这个查询信息中提取出长度为3的短语,长度为3的短语例如是“car mp3 player”等短语。

再例如,如果模式提取算法要求对查询信息进行语义转换,那么信息导航服务器在对查询信息进行分析时,就需要对查询信息进行语义转换。以查询信息“Nokia N95”为例,信息导航服务器可以将“Nokia N95”转换为“诺基亚手机”等模式。

当然,不同的模式提取算法会定义不同的查询信息分析方式,这里不再一一举例说明。

S203:所述信息导航服务器如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度。

在实际应用中,信息导航服务器可以通过多种方式计算每个模式的相似度。

例如,对于一个模式,信息导航服务器可以计算这个模式相对于查询信息丢掉每一个词的情况下所得的分数。之后,计算上述所有分数之和,这个分数之和就是这个模式的相似度。信息导航服务器在计算这个模式相对于查询信息丢掉一个词的情况下所得的分数时,可以首先判断丢掉的这个词的词性,从预先设置的记录词性与分值之间映射关系的映射表中查找与这个词的词性对应的分值,与这个词的词性对应的分值为第一分值;信息导航服务器也可以计算这个词在查询信息中的位置与中心词在查询信息中的位置之间的距离的得分,这个词在查询信息中的位置与中心词在查询信息中的位置之间的距离的得分为第二分值;信息导航服务器还可以计算这个词在查询信息中的位置与中心短语在查询信息中的位置之间的距离的得分,这个词在查询信息中的位置与中心短语在查询信息中的位置之间的距离的得分为第三分值;之后,信息导航服务器根据预先设置的分值算法,对第一分值、第二分值及第三分值进行计算,计算结果为这个模式相对于查询信息丢掉一个词的情况下所得的分数。在实际应用中,本领域技术人员可以根据实际需要设计出多种分值算法。例如,计算第一分值、第二分值及第三分值的平均值;例如,计算任意两个分值的平均值;例如,计算任意两个分值的平均值后,再与剩余的一个平均值相加或相乘。当然,分值算法还可以是其他形式的算法,这里不再一一举例说明。

需要说明的是,信息导航服务器计算第一分值、计算第二分值和计算第三分值这三个步骤之间没有必然的先后顺序关系,也就是说,信息导航服务器先计算哪个分值都可以。

为使本领域技术人员更加清楚的理解上述计算一个模式的相似度的方法,下面以查询信息“w1 w2 w3 w4 w5 w6”、其中的一个模式“w3 w5 w6”、中心短语“w4 w5 w6”、中心词“w6”为例,对上述计算一个模式的相似度的方法再次进行说明,其中,“w1”、“w2”、“w3”、“w4”、“w5”、“w6”分别代表查询信息中的6个词。

对于模式“w3 w5 w6”,其相对于查询信息“w1 w2 w3 w4 w5 w6”丢掉的词为“w1”、“w2”、“w4”。模式“w3 w5 w6”丢掉“w1”、“w2”、“w4”的计算方法分别如下:

(1)计算模式“w3 w5 w6”丢掉w1情况下的得分

假设w1为副词,在词性与分值对应的映射表中,副词对应0.2分,那么通过查表,可以得到fpos=0.2;

丢掉的词在查询信息中的位置与中心词在查询信息中的位置之间的距离的得分的计算公式为fdw=1-(d-1)*λ,d表示丢掉的词在查询信息中的位置与中心词在查询信息中的位置之间的距离,这里的λ表示fdw在fpos、fdw和fdp中的权重。对于w1,w1在查询信息中的位置与w6(中心词)在查询信息中的位置之间的距离为5,假设λ为0.0002,这种情况下,fdw=1-(d-1)*λ=1-(5-1)*0.0002=0.9992。

丢掉的词在查询信息中的位置与中心短语在查询信息中的位置之间的距离的得分的计算公式为fdp=1-d*λ,d表示丢掉的词在查询信息中的位置与中心短语的中间词在查询信息中的位置之间的距离,这里的λ表示fdp在fpos、fdw和fdp中的权重。需要说明的是,在实际应用中,有些中心短语没有实际的中间词,例如,中心短语“mp3 player”没有中间词,这种情况下,丢掉的词在查询信息中的位置与中心短语的中间词在查询信息中的位置之间的距离可以按照这种方式来计算,即,先计算中心短语的最后一个词在查询信息中的位置与中心短语的第一个词在查询信息中的位置之间的差值,将差值除以2后取上限的整数,再将第一个词在查询信息中的位置与所述取上限的整数相加,之后,再减去丢掉的词在查询信息中的位置,最后,取绝对值。例如,假设查询信息为“car mp3 player with fm transmitter 911”,中心短语为“mp3 player”,再假设丢掉的词为car,那么“car”与“mp3 player”的中间词之间的距离是:|2+((3-2)/2取上限整数)-1|=2。

对于w1,w1在查询信息中的位置与w5(中心短语的中间词)在查询信息中的位置之间的距离为4,假设λ为0.0001,这种情况下,fdp=1-d*λ=1-4*0.0001=0.9996。

一个模式丢掉一个词的情况下的得分的计算公式为score=(fpos+fdw+fdp)/3,模式“w3 w5 w6”丢掉w1的得分为score1=(0.2+0.9992+0.9996)/3=0.7329。

(2)计算模式“w3 w5 w6”丢掉w2情况下的得分

假设w2为名词,在词性与分值对应的映射表中,名词对应1分,那么通过查表,可以得到fpos=1;

w2在查询信息中的位置与w6(中心词)在查询信息中的位置之间的距离为4,假设λ为0.0002,这种情况下,fdw=1-(d-1)*λ=1-(4-1)*0.0002=0.9994。

w2在查询信息中的位置与w5(中心短语的中间词)在查询信息中的位置之间的距离为4,假设λ为0.0001,这种情况下,fdp=1-d*λ=1-3*0.0001=0.9997。

模式“w3 w5 w6”丢掉w2的得分为score2=(1+0.9994+0.9997)/3=0.9997。

(3)计算模式“w3 w5 w6”丢掉w4情况下的得分

假设w4为形容词,在词性与分值对应的映射表中,形容词对应0.6分,那么通过查表,可以得到fpos=0.6;

w4在查询信息中的位置与w6(中心词)在查询信息中的位置之间的距离为2,假设λ为0.0002,这种情况下,fdw=1-(d-1)*λ=1-(2-1)*0.0002=0.9998。

w4在查询信息中的位置与w5(中心短语的中间词)在查询信息中的位置之间的距离为1,假设λ为0.0001,这种情况下,fdp=1-d*λ=1-1*0.0001=0.9999。

模式“w3 w5 w6”丢掉w4的得分为score2=(0.6+0.9998+0.9999)/3=0.8666。

综合上述(1)、(2)、(3),查询信息“w3 w5 w6”的得分为score=score1+score2+score3=0.7329+0.9997+0.8666=2.5992。

当然,信息导航服务器还可以通过其他方式计算每个模式的相似度,例如,计算模式相对于查询信息丢掉的词的数量,每丢掉一个词可以记为1分,得分越多,相似度越低。对于计算每个模式的相似度的其他方式,这里不再一一举例说明。

S204:所述信息导航服务器按照相似度高低的顺序,对所有的模式进行排序。

在实际应用中,信息导航服务器既可以按照相似度由高到低的顺序,对所有的模式进行排序,还可以按照相似度由低到高的顺序,对所有的模式进行排序。

以查询信息“car mp3 player with fm transmitter 911”为例,假设信息导航服务器提取出的模式是“player”(中心词)、“mp3 player”(中心短语)、“car mp3player”(指定长度的短语)和“car mp3 player with transmitter”(丢词短语),假设相似度用分值来表示,再假设分值越高,相似度越高,信息导航服务器对每个模式都计算了分值,分值由高到低的短语依次为“car mp3 player withtransmitter”、“car mp3 player”、“mp3 player”、“player”,那么信息导航服务器按照分值由高到低的顺序,对这些模式的排序依次为“car mp3 player withtransmitter”、“car mp3 player”、“mp3 player”、“player”。

S205:所述信息导航服务器按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息。

信息导航服务器提取模式后,可以按照多种方式以模式为关键词,在映射表中查找导航信息。

例如,假设信息导航服务器按照相似度由高到低的顺序,对所有的模式进行了排序。这种情况下,信息导航服务器可以将排序第一的模式作为关键词,在映射表中查找与排序第一的模式对应的导航信息。如果查找到与排序第一的模式对应的导航信息,则将查找到的导航信息发送给客户端。如果没有查找到与排序第一的模式对应的导航信息,则将排序第二的模式作为关键词,在映射表中查找与排序第二的模式对应的导航信息。以此类推,直至查找到与模式对应的导航信息为止,或者,直至将所有的模式作为关键词,在映射表中查找完与所有的模式对应的导航信息为止。

以查询信息“car mp3 player with fm transmitter 911”为例,假设信息导航服务器提取出的模式是“player”(中心词)、“mp3 player”(中心短语)、“car mp3player”(指定长度的短语)和“car mp3 player with transmitter”(丢词短语),再假设相似度用分值来表示,信息导航服务器对每个模式都计算了分值,分值由高到低的短语依次为“car mp3 player with transmitter”、“car mp3 player”、“mp3 player”、“player”,那么信息导航服务器按照分值由高到低的顺序,对这些模式的排序依次为“car mp3 player with transmitter”、“car mp3 player”、“mp3 player”、“player”。之后,信息导航服务器首先以“car mp3 player withtransmitter”为关键词,在映射表中查找与“car mp3 player with transmitter”对应的类目(导航信息),如果查找到对应的类目,则可以停止查找,否则,再以“car mp3 player”为关键词,在映射表中查找与“car mp3 player”对应的类目(导航信息),如果查找到对应的类目,则可以停止查找,否则,再以“mp3player”为关键词,在映射表中查找与“mp3 player”对应的类目(导航信息),如果查找到对应的类目,则可以停止查找,否则,再以“player”为关键词,在映射表中查找与“player”对应的类目(导航信息),如果查找到对应的类目,则可以停止查找,否则,对于查询信息“car mp3 player with fm transmitter 911”,在映射表中查找不到任何对应的类目。

再例如,信息导航服务器可以按照排序,查找相似度较高的几个模式对应的导航信息,也就是说,无论在映射表中是否查找到相似度最高的模式对应的导航信息,都在映射表中查找其他几个相似度比较高的模式对应的导航信息。这样,在后续将导航信息发送给客户端的步骤中,信息导航服务器可以将这些相似度较高的模式对应的导航信息都发送给客户端。

S206:所述信息导航服务器将查找到的导航信息发送给客户端。

信息导航服务器可以根据不同的情形,通过不同的方式将查找到的导航信息发送给客户端。

例如,映射表中可以记录查询信息与导航信息的置信度,查询信息与导航信息的置信度用于表示查询信息与导航信息之间的关联程度。置信度可以用概率来表示,也可以用分值来表示,当然,还可以用其他形式来表示。置信度越高,说明查询信息与导航信息的关联程度越高。信息导航服务器如果查找到与某个模式对应的多个导航信息,那么可以将查找到的置信度最高的导航信息发送给客户端,或者可以将多个导航信息按照置信度大小进行排序,并按照该排序将多个导航信息均发送给客户端。还是以查询信息“car mp3 player with fmtransmitter 911”为例,信息导航服务器如果以模式“car mp3 player withtransmitter”为关键词,在映射表中查找到“播放器”、“电子产品”这两个类目,并且还查找到“car mp3 player with transmitter”与“播放器”的置信度为90%,“car mp3 player with transmitter”与“电子产品”的置信度为10%,那么可以只将“播放器”这个类目发送给客户端,或者将“播放器”排在第一位,将“电子产品”排在第二位后,将“播放器”和“电子产品”都发送给客户端。

在实际应用中,还可以将相似度与置信度结合,向客户端返回查询结果。例如,信息导航服务器在获得查询信息后,通过模式提取算法对查询信息进行分析,得到多个模式,计算每个模式的相似度,按照相似度高低的顺序对所有的模式进行排序。之后,首先将排序第一的模式作为关键词,在映射表中查找与排序第一的模式对应的导航信息。如果查找到与排序第一的模式对应的多个导航信息,并且查找到排序第一的模式与每个对应的导航信息的置信度,则将置信度最高的导航信息发送给客户端。

在实际应用中,可以通过多种方式计算置信度。

例如,置信度可以由人工指定,也就是说,映射表中的置信度可以由人工配置。

再例如,信息导航服务器可以获得记录查询信息与对应的导航信息的历史记录。历史记录可以存储在一个独立于信息导航服务器的数据库服务器中,当信息导航服务器需要获得历史记录时,从数据库服务器中获得历史记录。历史记录也可以存储在信息导航服务器中,当信息导航服务器需要获得历史记录时,直接在本地获得历史记录即可。历史记录中例如记录查询信息与对应的导航信息共同出现的次数、查询信息单独出现的次数、对应的导航信息单独出现的次数等信息。如果信息导航服务器或其他服务器在获得某个查询信息后,又获得客户端对某个导航信息的触发,那么信息导航服务器或其他服务器可以确定这个查询信息与这个导航信息对应。对于历史记录中的每个查询信息,信息导航服务器可以计算查询信息与对应的每个导航信息的条件概率,查询信息与对应的导航信息的条件概率即为查询信息与对应的导航信息之间的置信度。

如果历史记录中记录一个查询信息与一个导航信息直接对应,并且还记录这个查询信息与中间信息直接对应,中间信息能够与这个导航信息直接对应,那么信息导航服务器可以计算这个查询信息与这个导航信息同时出现的次数与这个查询信息出现的总次数之间的比值,为描述方便,这里将这个查询信息与这个导航信息同时出现的次数与这个查询信息出现的总次数之间的比值称为条件概率1。本申请实施例中的中间信息是指查询信息和导航信息对应的同一个信息,查询信息和导航信息可以通过中间信息建立对应关系。例如,假设某个查询信息与某个信息对应,再假设某个导航信息也与这个信息对应,那么这个查询信息就与这个导航信息对应。信息导航服务器还可以计算这个查询信息与中间信息同时出现的次数与这个查询信息出现的总次数之间的比值,为描述方便,这里将查询信息与中间信息同时出现的次数与这个查询信息出现的总次数之间的比值称为条件概率2。之后,信息导航服务器计算条件概率1与对应条件概率1的权重的乘积,计算条件概率2与对应条件概率2的权重的乘积,并将两个乘积相加,得到这个查询信息与这个导航信息的条件概率。对应条件概率1的权重和对应条件概率2的权重可以根据经验值或者线性回归方法确定。

下面再以导航信息为类目为例,说明如何确定一个查询信息与一个导航信息的置信度。

给定用户输入的查询信息queryi,对应queryi的类目集合为{category1,category2...categoryj...},则对于查询信息queryi,queryi与categoryj的条件概率定义为p(categoryj|queryi)。对于所有的类目,满足条件:Σjp(categoryj|queryi)=1.

在实际应用中,一个用户在输入查询信息后,可能会点击某个类目,也可能只点击其他信息(例如某个产品的信息)而不点击类目。另外,由于其他信息与类目之间也可能具有对应关系,例如,一个产品的信息是属于某个类目的,所以,信息导航服务器或者其他服务器可以预先配置有记录其他信息与类目之间映射关系的映射表,当然,也可以实时更新映射表。所以,即使用户在输入查询信息后,没有点击类目而是直接点击其他信息,那么信息导航服务器或者其他服务器也可以确定查询信息与类目之间的对应关系。这里的其他信息就是一种中间信息。因此,在计算queryi与categoryj的条件概率时,不但可以考虑查询信息与类目直接对应的情形,还可以考虑查询信息与类目间接对应的情形。

在具体实现时,信息导航服务器获得历史记录后,可以查找queryi与categoryj同时出现的次数。如果用户在输入queryi后,又点击categoryj,则记录queryi与categoryj同时出现1次。信息导航服务器还要查找queryi出现的总次数。queryi出现的总次数是指所有的用户输入queryi的总次数。信息导航服务器计算queryi与categoryj直接对应的条件概率为:

p(categoryj|queryi)=count(categoryj,queryi)count(queryi)

其中,count(categoryj,queryi)表示查找queryi与categoryj同时出现的次数,count(queryi)表示所有的用户输入queryi的总次数。

在具体实现时,信息导航服务器获得历史记录后,还可以获得记录中间信息与类目之间映射关系的映射表,这个映射表既可以存储在数据库服务器中,也可以存储在信息导航服务器中。信息导航服务器获得这个映射表后,查找与类目categoryj对应的所有中间信息。之后,在历史记录中查找queryi与上述所有中间信息同时出现的次数。如果用户在输入queryi后,又点击某个中间信息,则记录queryi与这个中间信息同时出现1次。另外,信息导航服务器还要查找queryi出现的总次数。这种情况下,信息导航服务器计算queryi与categoryj间接对应的条件概率为:

p(categoryj|queryi,offer)=count(categoryj,queryi|offer)count(queryi|offer)

其中,count(categoryj,queryi|offer)表示queryi与中间信息同时出现的次数,中间信息是指与categoryj对应的所有中间信息,count(queryi|offer)表示queryi出现的总次数。

对得到的上述两个条件概率线性加权,得到queryi与categoryj的置信度:

p(categoryj|queryi)=λ1p′(categoryj|queryi)+λ2p″(categoryj|queryi,offer)

其中,λ1和λ2表示权重,可根据经验值或者线性回归方法确定。

需要说明的是,图2所示的方法实施例只是本申请的一种实施例,在实际应用中,本领域技术人员完全可以根据图2所示的方法实施例,得到更多的实施例。

例如,在执行S201后,信息导航服务器可以首先以获得的查询信息为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找是否存在与获得的查询信息对应的导航信息,如果存在,则可以直接将查找到的导航信息发送给客户端,否则,再执行S202。进一步的,如果在映射表中查找到多个与查询信息对应的导航信息,并且映射表中还记录查询信息与每个对应的导航信息的置信度,则可以只将置信度最高的导航信息发送给客户端。

例如,信息导航服务器可以实时或定时更新映射表中的映射关系和置信度,这样可以进一步提高查询导航信息的准确性。

例如,对于查询信息是单个字母、单个数字、单个符号或英文短语缩写的情形,信息导航服务器可以通过语义转换的方式,将这类查询信息转换为至少一个模式。假设信息导航服务器获得的查询信息为“LV”,那么信息导航服务器可以将“LV”转换为“LOUIS VUITTON”。为便于实现,信息导航服务器可以预先存储记录这类查询信息与转换后的信息之间映射关系的映射表,当信息导航服务器获得这类查询信息后,以这类查询信息为关键词,在这个映射表中查找转换后的信息。另外,这个映射表中除了记录查询信息与转换后的信息之间的映射关系外,还可以记录查询信息与转换后的信息的置信度。这种情况下,如果信息导航服务器在这个映射表中查找到多个与查询信息对应的转换后的信息,那么信息导航服务器可以只选择置信度最高的转换后的信息作为模式。

例如,如果信息导航服务器通过模式得到与查询信息对应的导航信息,那么信息导航服务器可以在记录查询信息与导航信息之间映射关系的映射表中记录获得的查询信息与得到的导航信息之间的映射关系。如果还计算出获得的查询信息与得到的导航信息的置信度,则还在映射表中记录置信度。这样,当信息导航服务器获得同样的查询信息后,可以直接在记录查询信息与导航信息之间映射关系的映射表中得到对应的导航信息,并可以根据置信度选择发送给客户端的导航信息。

例如,如果信息导航服务器通过模式得到与查询信息对应的多个导航信息,还得到每个模式与每个对应的导航信息的置信度,那么信息导航服务器可以计算获得的查询信息与模式对应的导航信息的置信度。具体的,如果信息导航服务器判断查找到的某个导航信息只与一个模式对应,那么信息导航服务器可以将这个模式与这个导航信息的置信度作为获得的查询信息与这个导航信息的置信度。如果信息导航服务器判断查找到的某个导航信息对应多个模式,也就是说,有多个模式都对应同一个导航信息,那么信息导航服务器可以将这个导航信息与每个模式的置信度相加,并进行平均运算,得到的值即为获得的查询信息与这个导航信息的置信度。

例如,如果信息导航服务器只得到一个模式,那么信息导航服务器就以这个模式作为关键词,实际上是将这个模式作为一个新的查询信息,在映射表中查找与这个模式对应的导航信息。如果映射表中没有记录这个模式,那么信息导航服务器就查找不到这个模式对应的导航信息;如果映射表中记录有这个模式与对应的导航信息,那么信息导航服务器就能查找到这个模式对应的导航信息。

再例如,信息导航服务器如果没有找到与任何的模式对应的导航信息,那么信息导航服务器可以采用机器学习方式预测到与所述查询信息对应的导航信息。

机器学习方法可以通过对历史查询信息的学习和训练,计算获取到查询信息的特征归类于某一导航信息的概率分布,在本申请实施例中,查询信息的特征例如是产品标签、品牌标签、型号标签、中心词、所有名词短语、中心词与左邻名词短语、中心词与右邻名词短语等。

具体的,假设某一个类目为C类,则当前查询信息被划分为该类目C的置信度就可以用如下方式表示:在给定相关信息x的条件下,当前查询信息确定属于该类目C的后验概率p(c is correct|x),其中,所述x代表的信息即是给定信息,在本实施例中为从当前查询信息提取的产品标签、品牌标签、型号标签、中心词、所有名词短语、中心词与左邻名词短语、中心词与右邻名词短语。产品标签用于标识当前查询信息为某一产品信息,通过语义识别得出。品牌标签用于标识当前查询信息为某一品牌信息,通过语义识别得出。型号标签用于标识当前查询信息为某一型号信息,通过语义识别得出。

条件概率模型可以训练当前查询信息所得到的特征的权重,通过训练得到的对应的特征值和权重,来利用条件概率模型计算当前查询信息被确定为某一类目的条件概率。

条件概率模型优选情况下可以选择最大熵模型,其公式如下所示:

p(y|x)=1Z(x)exp(Σjλjfj(x,y))

其中y∈{c is correct,c is incorrect};x是当前查询信息所对应的给定信息,在本实施例中为产品标签、品牌标签、型号标签、中心词、所有名词短语、中心词与左邻名词短语、中心词与右邻名词短语;fj是最大熵模型对应的特征值,例如,即是当x为词一级特征时,如果在训练数据中能够匹配到“当前查询信息的关键词包括phon时,所属类目为C”,则特征fj在条件“当前查询信息的关键词包括phon时”的值就为1,否则为0;λj是当前查询信息的各个特征对应的权重,可以通过模型训练得到的;Z(x)是归一化因子,也通过模型训练得到。

在实际应用中,还可以采用线性回归等机器学习模型来建立条件概率模型。在实际应用中,还可以采用支持向量机模型,虽然不是条件概率模型,但是计算的分值也可以用来作为置信度,置信度用于表示查询信息与类目之间的关联程度。

在实际应用中,类目可能会被分为多个级别,因此可以采用多级分类器,例如,假设“交通工具”是第一级别的类目,或者称为根类目,“交通工具”的下一个级别类目包括“汽车”、“火车”、“飞机”、“轮船”,“汽车”的下一个级别类目包括“家用汽车”、“重载汽车”。这种情况下,信息导航服务器可以先使用机器学习方式计算查询信息与多个或所有的根类目的置信度,之后,计算查询信息与置信度最高的根类目的下一个级别类目的置信度,以此类推,计算查询信息与置信度最高的下一个级别类目的下一个级别类目的置信度。

信息导航服务器通过机器学习方式得到查询信息与导航信息(例如类目)的置信度后,可以将置信度最高的导航信息发送给客户端,也可以将置信度较高的导航信息发送给客户端,还可以按照置信度高低的排序,将多个导航信息发送给客户端。至于信息导航服务器将何种导航信息发送给客户端,可以由本领域技术人员根据实际需要而设计,这里不再一一举例。

当然,本领域技术人员通过图2所示的方法实施例的描述,还可以得到其他实施例,这里不再一一举例说明。

对应于图2所示的方法实施例,本申请实施例还提供一种信息导航服务器。如图3所示,这种信息导航服务器包括:存储单元301,用于存储记录查询信息与导航信息之间映射关系的映射表;获得单元302,用于获得客户端提供的查询信息;分析单元303,用于通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;计算单元304,用于在分析单元303得到多个模式时,计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;排序单元305,用于按照相似度高低的顺序,对所有的模式进行排序;查找单元306,用于按照所述排序,将模式作为关键词,在所述映射表中查找与模式对应的导航信息;发送单元307,用于将查找到的导航信息发送给客户端。

分析单元303具体可以用于从查询信息中提取中心词和/或中心短语。

分析单元303具体可以用于从查询信息中提取指定长度的短语,所述指定长度的短语包括中心词或中心短语。

对于一个模式,计算单元304具体可以用于计算所述模式相对于查询信息丢掉每一个词的情况下所得的分数,并计算上述所有分数之和,所述分数之和为所述模式的相似度。

存储单元301还可以存储记录词性与分值之间映射关系的映射表。计算单元304可以包括:判断子单元,用于判断丢掉的词的词性;查找子单元,用于从所述映射表中查找与所述词的词性对应的分值,与所述词的词性对应的分值为第一分值;第一计算子单元,用于计算所述词在查询信息中的位置与中心词在查询信息中的位置之间的距离的得分,所述词在查询信息中的位置与中心词在查询信息中的位置之间的距离的得分为第二分值;第二计算子单元,用于计算所述词在查询信息中的位置与中心短语在查询信息中的位置之间的距离的得分,所述词在查询信息中的位置与中心短语在查询信息中的位置之间的距离的得分为第三分值;第三计算子单元,用于根据预先设置的分值算法,对所述第一分值、所述第二分值及所述第三分值进行计算,计算结果为所述模式相对于查询信息丢掉一个词的情况下所得的分数。在实际应用中,本领域技术人员可以根据实际需要设计出多种分值算法。例如,计算第一分值、第二分值及第三分值的平均值;例如,计算任意两个分值的平均值;例如,计算任意两个分值的平均值后,再与剩余的一个平均值相加或相乘。当然,分值算法还可以是其他形式的算法,这里不再一一举例说明。

查找单元306将排序第一的模式作为关键词,在映射表中查找与排序第一的模式对应的导航信息;如果查找单元306查找到与排序第一的模式对应的导航信息,则发送单元307将查找到的导航信息发送给客户端;如果查找单元306没有查找到与排序第一的模式对应的导航信息,则查找单元306将排序第二的模式作为关键词,在映射表中查找与排序第二的模式对应的导航信息;以此类推,直至查找单元306查找到与模式对应的导航信息为止,或者,直至查找单元306将所有的模式作为关键词,在映射表中查找完与所有的模式对应的导航信息为止。

上述映射表中还可以记录查询信息与导航信息的置信度,所述查询信息与导航信息的置信度用于表示查询信息与导航信息之间的关联程度;如果查找单元306查找到与一个模式对应的多个导航信息,则发送单元307将查找到的置信度最高的导航信息发送给客户端,或将所述多个导航信息排序后发送给客户端。

获得单元302获得客户端提供的查询信息之前,还获得记录查询信息与对应的导航信息的历史记录。这种情况下,对于历史记录中的每个查询信息,计算单元304计算查询信息与对应的每个导航信息的条件概率,查询信息与对应的导航信息的条件概率为查询信息与对应的导航信息之间的置信度。计算单元304可以将置信度保存在存储单元301中。

如果历史记录中记录一个查询信息与一个导航信息直接对应,并且还记录所述查询信息与中间信息直接对应,中间信息能够与所述导航信息直接对应,则计算单元304可以包括:第四计算单元,用于计算所述查询信息与所述导航信息同时出现的次数与所述查询信息出现的总次数之间的比值,所述查询信息与所述导航信息同时出现的次数与所述查询信息出现的总次数之间的比值为条件概率1;第五计算单元,用于计算所述查询信息与所述中间信息同时出现的次数与所述查询信息出现的总次数之间的比值,所述查询信息与所述中间信息同时出现的次数与所述查询信息出现的总次数之间的比值为条件概率2;第六计算单元,用于计算条件概率1与对应条件概率1的权重的乘积,计算条件概率2与对应条件概率2的权重的乘积,并将两个乘积相加,得到所述查询信息与所述导航信息的条件概率。

图3所示的信息导航服务器还可以包括机器学习单元308,用于在查找单元306没有查找到与任何模式对应的导航信息时,获得查找单元306的触发,采用机器学习方式预测到与查询信息对应的导航信息。

由于图3所示的信息导航服务器的实施例是与图2所示的方法实施例相对应的,所以,图3所示的信息导航服务器中的各个单元的功能以及相互之间的配合关系的具体描述可以参照图2所示的方法实施例中的相关描述,这里不再赘述。

由于信息导航服务器可以部署在信息处理系统中,所以,本申请实施例还提供一种信息处理系统。如图1所示,信息处理系统包括客户端102及信息导航服务器101;客户端102用于与信息导航服务器101交互信息;信息导航服务器101用于:获得客户端102提供的查询信息;通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;按照相似度高低的顺序,对所有的模式进行排序;按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息,将查找到的导航信息发送给客户端102。

信息导航服务器101的具体功能、客户端102的具体功能以及信息导航服务器101与客户端102的配合关系的具体描述可以参见图2所示的方法实施例和图3所示的信息导航服务器实施例中的相关描述,这里不再赘述。

除图2所示的方法实施例外,本申请实施例还提供一种信息导航的实现方法。如图4所示,这种方法包括:

S401:信息导航服务器获得客户端提供的查询信息。

这个步骤的具体描述可以参见图2所示的方法实施例中S201的相关描述,这里不再赘述。

S402:所述信息导航服务器使用方式(1)查找与所述查询信息对应的导航信息,并采用机器学习方式预测到与所述查询信息对应的导航信息。

其中,方式(1)包括:信息导航服务器通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;所述信息导航服务器如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;所述信息导航服务器按照相似度高低的顺序,对所有的模式进行排序;所述信息导航服务器按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息。

方式(1)的具体描述可以参见图2所示的方法实施例中S202、S203、S204和S205的相关描述,这里不再赘述。

S403:所述信息导航服务器如果使用方式(1)查找到与所述查询信息对应的导航信息,则根据两种方式得到的导航信息,确定提供给客户端的导航信息,并将确定提供给客户端的导航信息发送给客户端。

在实际应用中,信息导航服务器可以通过多种方式确定提供给客户端的导航信息。例如,将使用两种方式得到的相同的导航信息发送给客户端。例如,将每种方式得到的导航信息都发送给客户端。再例如,可以根据前面描述的置信度方式,将置信度最高的导航信息发送给客户端。再例如,按照置信度高低进行排序,将排序后的多个导航信息发送给客户端。当然,信息导航服务器还可以通过其他方式确定提供给客户端的导航信息,这里不再一一举例说明。

对应于图4所示的方法实施例,本申请实施例还提供一种信息导航服务器。如图5所示,这种信息导航服务器包括:存储单元501,用于存储记录查询信息与导航信息之间映射关系的映射表;获得单元502,用于获得客户端提供的查询信息;第一查找单元503,用于使用方式(1)查找与所述查询信息对应的导航信息;第二查找单元504,采用机器学习方式预测到与所述查询信息对应的导航信息;导航信息确定单元505,用于如果第一查找单元503使用方式(1)查找到与所述查询信息对应的导航信息,则根据第一查找单元503得到的导航信息和第二查找单元504得到的导航信息,确定提供给客户端的导航信息;发送单元506,用于将确定提供给客户端的导航信息发送给客户端;其中,方式(1)包括:信息导航服务器通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;按照相似度高低的顺序,对所有的模式进行排序;按照所述排序,将模式作为关键词,在所述映射表中查找与模式对应的导航信息。

由于图5所示的信息导航服务器的实施例是与图4所示的方法实施例相对应的,所以,图5所示的信息导航服务器中的各个单元的功能以及相互之间的配合关系的具体描述可以参照图4所示的方法实施例中的相关描述,这里不再赘述。

由于信息导航服务器可以部署在信息处理系统中,所以,本申请实施例还提供一种信息处理系统。如图1所示,信息处理系统包括客户端102及信息导航服务器101;客户端102用于与信息导航服务器101交互信息;信息导航服务器101用于获得客户端102提供的查询信息,使用方式(1)查找与所述查询信息对应的导航信息,并采用机器学习方式预测到与所述查询信息对应的导航信息,如果使用方式(1)查找到与所述查询信息对应的导航信息,则根据两种方式得到的导航信息,确定提供给客户端的导航信息,并将确定提供给客户端的导航信息发送给客户端;其中,方式(1)包括:信息导航服务器通过模式提取算法对所述查询信息进行分析,得到至少一个模式,所述模式为从所述查询信息中提取的信息或对所述查询信息进行语义转换后获得的信息,所述模式用于表征所述查询信息;如果得到多个模式,则计算每个模式的相似度,所述模式的相似度用于表示模式与所述查询信息之间的相似程度;按照相似度高低的顺序,对所有的模式进行排序;按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息。

信息导航服务器101的具体功能、客户端102的具体功能及两者的配合关系的具体描述可以参见图4所示的方法实施例和图5所示的信息导航服务器实施例中的相关描述,这里不再赘述。

综上所述,本申请实施例中,信息导航服务器在获得客户端提供的查询信息后,可以通过模式提取算法对所述查询信息进行分析,得到至少一个模式,如果得到多个模式,则计算每个模式的相似度,按照相似度高低的顺序,对所有的模式进行排序,再按照所述排序,将模式作为关键词,在记录查询信息与导航信息之间映射关系的映射表中查找与模式对应的导航信息。这种情况下,即使从客户端获得的查询信息在映射表中不存在,那么由于模式可能会在映射表中存在,所以也有可能查找到合适的导航信息,解决了信息导航服务器无法为客户端提供与映射表中不存在的查询信息对应的导航信息。

另外,信息导航服务器如果在记录查询信息与导航信息之间映射关系的映射表中查找不到任何的模式对应的导航信息,那么可以采用机器学习的方式得到获得的查询信息对应的导航信息,这样可以进一步保证信息导航服务器能够针对客户端提供的查询信息返回对应的导航信息。

此外,信息导航服务器除可以通过模式查找获得的查询信息对应的导航信息外,还可以采用机器学习的方式得到导航信息,并根据两种方式得到的导航信息,确定为客户端返回的导航信息,这样可以进一步提高返回给客户端的导航信息的全面性和准确度。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号