首页> 中国专利> 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质

基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质

摘要

本发明公开基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,通过将用户需要搜索的图片导入至网页搜索引擎,同时通过用户选择搜索方式,若用户选择图片搜索方式,则分析计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照综合匹配度符合系数差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则分析计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,提高网页搜索引擎的智能排序水平。

著录项

  • 公开/公告号CN113282834A

    专利类型发明专利

  • 公开/公告日2021-08-20

    原文格式PDF

  • 申请/专利权人 武汉瑞通慧行电子商务有限公司;

    申请/专利号CN202110664490.5

  • 发明设计人 刘伟;

    申请日2021-06-16

  • 分类号G06F16/9535(20190101);G06F16/9538(20190101);G06F40/216(20200101);G06K9/46(20060101);G06T7/62(20170101);

  • 代理机构34173 合肥集知匠心知识产权代理事务所(普通合伙);

  • 代理人郑琍玉

  • 地址 430000 湖北省武汉市东湖新技术开发区流芳大道52号武汉·中国光谷文化创意产业园

  • 入库时间 2023-06-19 12:18:04

说明书

技术领域

本发明涉及网页搜索排序技术领域,涉及到基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。

背景技术

随着互联网技术的发展和普及,网页搜索几乎已经成为现代人闲余生活中获取有效信息的必备途经。随着网页搜索引擎在人们生活中使用频率的提高,对网页搜索内容排序管理研究也更加重要。

目前,现有的网页图片搜索排序管理基本根据图片上传时间进行排序,这样方式虽然简洁、方便,但是无法实现网页搜索引擎中图片排序管理的智能化水平,导致用户需求的图片被深埋在众多图片中难以快速查找,从而增加用户查找类似图片的时间,降低用户搜索需求图片的效率,同时现有的网页图片搜索无法实现多种搜索方式的选择,从而不能满足用户的实际搜索需求,减少用户对网页图片搜索的体验感和满意感,进而影响网页搜索引擎的智能排序水平,为了解决以上问题,现设计基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质。

发明内容

本发明的目的在于提供基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,本发明通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序;若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,解决了背景技术中存在的问题。

本发明的目的可以通过以下技术方案实现:

第一方面,本发明提供基于移动互联网数据深度挖掘的网页搜索智能排序方法,包括如下步骤:

S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7;

S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积;

S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比;

S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词;

S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数;

S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξ

S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′

S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词;

S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合f

S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。

进一步地,所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s

进一步地,所述用户搜索图片中各特征点区域的面积占比计算公式为

进一步地,所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合W

进一步地,所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为

进一步地,所述用户导入搜索图片的综合匹配度符合系数计算公式为

进一步地,所述用户导入搜索图片中各类别图像的权重比例计算公式为

进一步地,所述网页搜索引擎中各文本的综合匹配度符合系数计算公式为

第二方面,本发明还提供基于移动互联网数据深度挖掘的网页搜索智能排序系统,包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;

所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。

第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的方法。

有益效果:

(1)本发明提供的基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质,通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,为后期计算用户导入搜索图片的综合匹配度符合系数提供可靠的参考数据,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序,从而实现网页搜索引擎中图片排序管理的智能化水平,确保用户需求的图片能够快速查找,减少用户查找类似图片的时间,提供用户搜索需求图片的效率。

(2)本发明中若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,为后期计算网页搜索引擎中各文本的综合匹配度符合系数提供可靠的参考依据,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,增加用户对网页图片搜索的体验感和满意感,进而提高网页搜索引擎的智能排序水平。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的方法步骤示意图;

图2为本发明的模块连接结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1所示,本发明的第一方面提供基于移动互联网数据深度挖掘的网页搜索智能排序方法,包括如下步骤:

S1、用户搜索图片导入:通过图片导入模块将用户需要搜索的图片进行导入,按照设定的图片格式和规格导入至网页搜索引擎,并通过用户选择网页搜索引擎的搜索方式,若用户选择图片搜索方式,则进行步骤S2,若用户选择文本搜索方式,则进行步骤S7。

S2、图片特征点提取:通过特征点提取模块对用户导入搜索图片中各特征点进行提取,得到用户导入搜索图片中各特征点区域,并获取用户导入搜索图片中各特征点区域的面积。

在本实施例中,所述步骤S2中包括统计用户导入搜索图片中各特征点区域的面积,构成用户导入搜索图片中各特征点区域的面积集合S(s

S3、区域面积占比分析:通过面积占比分析模块提取网页搜索引擎中图片导入的设定规格面积,计算用户搜索图片中各特征点区域的面积占比,统计用户搜索图片中各特征点区域的面积占比。

在本实施例中,所述用户搜索图片中各特征点区域的面积占比计算公式为

具体地,本发明通过提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,为后期计算用户导入搜索图片的综合匹配度符合系数提供可靠的参考数据。

S4、图片文字信息获取:通过文字信息提取模块对用户导入搜索图片的文字信息进行提取,得到用户导入搜索图片的文字信息,并按照文本位置先后顺序依次提取用户导入搜索图片的文字信息中各有效词。

S5、搜索图片主题统计:通过图片主题获取模块对用户导入搜索图片的文字信息中各有效词对应的主题进行获取,分别获取用户导入搜索图片的文字信息中各有效词对应的主题,统计用户导入搜索图片的文字信息中各主题内各有效词,并获取用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号,计算用户导入搜索图片的文字信息中各主题的权重系数。

在本实施例中,所述步骤S5中包括构成用户导入搜索图片的文字信息中各主题内各有效词所处文本位置编号集合W

在本实施例中,所述用户导入搜索图片的文字信息中各主题的权重系数计算公式为

S6、图片匹配度符合系数分析:通过分析服务器将用户导入搜索图片的文字信息中各主题的权重系数进行对比,筛选用户导入搜索图片的文字信息中权重系数最大的主题,并将该主题记为用户导入搜索图片的文字信息对应主题,同时提取用户导入搜索图片的文字信息对应主题的权重系数ξ

在本实施例中,所述用户导入搜索图片的综合匹配度符合系数计算公式为

具体地,本发明通过将用户需要搜索的图片导入至网页搜索引擎,若用户选择图片搜索方式,则提取用户导入搜索图片中各特征点区域,分析用户搜索图片中各特征点区域的面积占比,同时获取用户导入搜索图片的文字信息中各主题内各有效词,计算用户导入搜索图片的文字信息中各主题的权重系数,筛选用户导入搜索图片的文字信息中权重系数最大的主题,计算用户导入搜索图片的综合匹配度符合系数,对比得到网页搜索引擎中各图片的综合匹配度符合系数差值,并按照差值从小到大顺序依次进行排序,从而实现网页搜索引擎中图片排序管理的智能化水平,确保用户需求的图片能够快速查找,减少用户查找类似图片的时间,提供用户搜索需求图片的效率。

S7、类别图像面积获取:通过图片处理模块将用户导入搜索图片进行分割处理,获得用户导入搜索图片中各类别图像面积,构成用户导入搜索图片中各类别图像面积集合S′(s′

在本实施例中,所述用户导入搜索图片中各类别图像的权重比例计算公式为

具体地,本发明通过获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,为后期计算网页搜索引擎中各文本的综合匹配度符合系数提供可靠的参考依据。

S8、类别图像关键词获取:通过关键词获取模块对用户导入搜索图片中各类别图像对应的关键词进行获取,统计用户导入搜索图片中各类别图像对应的关键词。

S9、文本关键词词频统计:通过关键词词频统计模块对网页搜索引擎中各文本内容内各关键词的词频进行统计,分别构成网页搜索引擎中各文本内容内各关键词的词频集合f

S10、文本匹配度符合系数分析:通过分析服务器提取存储数据库中存储的文本关键词词频对应的权重修正系数,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次对网页搜索引擎中各文本进行排序。

在本实施例中,所述网页搜索引擎中各文本的综合匹配度符合系数计算公式为

具体地,本发明中若用户选择文本搜索方式,则获得用户导入搜索图片中各类别图像面积,计算用户导入搜索图片中各类别图像的权重比例,同时获取用户导入搜索图片中各类别图像对应的关键词,统计网页搜索引擎中各文本内容内各关键词的词频,计算网页搜索引擎中各文本的综合匹配度符合系数,并按照综合匹配度符合系数从大到小的顺序依次进行排序,从而实现多种搜索方式选择的功能,满足用户的实际搜索需求,增加用户对网页图片搜索的体验感和满意感,进而提高网页搜索引擎的智能排序水平。

请参阅图2所示,本发明的第二方面还提供基于移动互联网数据深度挖掘的网页搜索智能排序系统,包括图片导入模块、特征点提取模块、面积占比分析模块、文字信息提取模块、图片主题获取模块、图片处理模块、关键词获取模块、关键词词频统计模块、分析服务器和存储数据库;

所述图片导入模块分别与特征点提取模块和图片处理模块连接,面积占比分析模块分别与特征点提取模块和分析服务器连接,图片主题获取模块分别与文字信息提取模块和分析服务器连接,关键词获取模块分别与图片处理模块和关键词词频统计模块连接,分析服务器分别与关键词词频统计模块和存储数据库连接。

第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的方法。

以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号