首页> 中国专利> 一种社区网站页面的图片检索方法和系统

一种社区网站页面的图片检索方法和系统

摘要

本发明公开了一种社区网站页面的图片检索方法和系统,方法包括:从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片;将检索所得的图片通过所述社区网站页面进行展示。通过本发明,能够降低用户进行页面输入时获取图片的复杂度,提高输入效率,增加用户体验。

著录项

  • 公开/公告号CN102999489A

    专利类型发明专利

  • 公开/公告日2013-03-27

    原文格式PDF

  • 申请/专利权人 腾讯科技(深圳)有限公司;

    申请/专利号CN201110265385.0

  • 发明设计人 庄子明;

    申请日2011-09-08

  • 分类号G06F17/30(20060101);

  • 代理机构11270 北京派特恩知识产权代理事务所(普通合伙);

  • 代理人蒋雅洁;程立民

  • 地址 518044 广东省深圳市福田区振兴路赛格科技园2栋东403室

  • 入库时间 2024-02-19 18:28:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-10-16

    专利权的转移 IPC(主分类):G06F17/30 登记生效日:20180921 变更前: 变更后: 申请日:20110908

    专利申请权、专利权的转移

  • 2016-08-03

    授权

    授权

  • 2013-04-24

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20110908

    实质审查的生效

  • 2013-03-27

    公开

    公开

说明书

技术领域

本发明涉及互联网技术领域,尤其涉及一种社区网站页面的图片检索方法 和系统。

背景技术

随着互联网技术的不断发展,各种互联网应用产品日益丰富。目前流行的 社区网站大都提供了用户上传图片和图片链接的功能,有些也提供了预设好的 一系列图片供用户选择使用。微博社区是社区网站的一种,以微博社区为例, 图1所示的微博社区提供了用户上传图片和图片链接的功能,图2所示的微博 社区不仅提供了用户上传图片和图片链接的功能,还提供了预设好的一系列图 片供用户选择使用。

然而,现有技术中,当用户在互联网的页面进行文字和/或图片输入时,如 果用户所在的客户端没有用户所需要上传的图片,同时互联网提供的预设图片 中也没有符合用户需求的图片,那么用户需要访问到搜索引擎或者图片资源网 站去进行的检索并获取相关的图片。这样的操作比较繁琐,而且不利于提高用 户的输入效率,带来不好的用户体验。

发明内容

有鉴于此,本发明的主要目的在于提供一种社区网站页面的图片检索方法 和系统,以降低用户进行页面输入时获取图片的复杂度,提高输入效率。

为达到上述目的,本发明的技术方案是这样实现的:

本发明提供了一种社区网站页面的图片检索方法,该方法包括:

从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜 索引擎检索图片;

将检索所得的图片通过所述社区网站页面进行展示。

所述根据获取的关键词在相应的搜索引擎检索图片,具体为:

搜索引擎从图片资源网站或图片资源库中抓取图片索引与所述关键词相匹 配的图片,作为检索所得的图片。

所述从社区网站页面获取检索图片的关键词,具体为:

从社区网站页面的搜索引擎入口提取所述关键词。

所述从社区网站页面获取检索图片的关键词,具体为:

从社区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。

该方法进一步包括:

从输入文本T中抽选特征关键词,所述特征关键词的集合标记为向量W, 其中,W={w1,w2,w3,...,wm},wi表示特征关键词i,1≤i≤m,m为正整 数;

计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性 分值向量标记为F,其中,F={f1,f2,f3,...,fm},fi表示wi的重要性分值, 1≤i≤m,m为正整数;

搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P={p1, p2,p3,...,pn},pj表示图片j,1≤j≤n,n为正整数;图片pj对应的词汇向量 标记为Wj、相应的重要性分值标记为Fj,其中,Wj={w′1,w′2,w′3,...,w′q}, w′k表示pi的索引词汇k,Fj={f′1,f′2,f′3′...,f′q},f′k表示w′k的重要性分值, 1≤k≤q,q为正整数;计算图片pj的推荐分值S(T,pj)=F·Fj,并选取S 最大的一张图片、或S按照从大到小顺序的多张图片作为最终检索所得的图片。

所述从社区网站页面获取检索图片的关键词之后,该方法进一步包括:对 所述关键词进行归一化处理;

相应的,检索图片所使用的关键词是经过归一化处理的关键词。

所述将检索所得的图片通过所述社区网站页面进行展示,具体为:

将检索获得的图片按照关键词与图片索引的匹配程度从高到低的顺序进行 排序并展示。

本发明还提供了一种社区网站页面的图片检索系统,该系统包括:图片检 索模块和图片展示模块,其中,

所述图片检索模块,用于从社区网站页面获取检索图片的关键词,并根据 获取的关键词在相应的搜索引擎检索图片;

所述图片展示模块,用于将检索所得的图片通过所述社区网站页面进行展 示。

所述图片检索模块进一步用于,通过搜索引擎从图片资源网站或图片资源 库中抓取图片索引与所述关键词相匹配的图片,作为检索所得的图片。

所述图片检索模块进一步用于,从社区网站页面的搜索引擎入口提取所述 关键词。

所述图片检索模块进一步用于,从社区网站页面上的输入文本中抽选特征 关键词,作为检索图片的关键词。

所述图片检索模块进一步用于,从输入文本T中抽选特征关键词,所述特 征关键词的集合标记为向量W,其中,W={w1,w2,w3,...,wm},wi表示特 征关键词i,1≤i≤m,m为正整数;计算每个特征关键词对所述输入文本T的 重要性分值,对应于W的重要性分值向量标记为F,其中,F={f1,f2,f3,..., fm},fi表示wi的重要性分值,1≤i≤m,m为正整数;

将搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P={p1, p2,p3,...,pn},pj表示图片j,1≤j≤n,n为正整数;图片pj对应的词汇向量 标记为Wj、相应的重要性分值标记为Fj,其中,Wj={w′1,w′2,w′3,...,w′q}, w′k表示pi的索引词汇k,Fj={f′1,f′2,f′3,...,f′q},f′k表示w′k的重要性分值, 1≤k≤q,q为正整数;通过计算图片pj的推荐分值S(T,pj)=F·Fj,选取S 最大的一张、或S按照从大到小顺序的多张图片作为最终检索所得的图片。

所述图片检索模块进一步用于,对所获取的关键词进行归一化处理,并根 据归一化处理后的关键词在相应的搜索引擎检索图片。

所述图片展示模块进一步用于,将检索获得的图片按照关键词与图片索引 的匹配程度从高到低的顺序进行排序并展示。

本发明所提供的一种社区网站页面的图片检索方法和系统,从社区网站页 面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片; 将检索所得的图片通过所述社区网站页面进行展示。通过本发明,简化了用户 进行页面输入过程中获取图片的检索操作,降低了用户进行页面输入时获取图 片的复杂度,提高了输入效率,增加了用户体验。

附图说明

图1为现有技术中微博社区的页面示意图一;

图2为现有技术中微博社区的页面示意图二;

图3为本发明实施例的一种社区网站页面的图片检索方法的流程图;

图4为本发明实施例一中社区网站页面的图片检索方法的流程图;

图5为本发明实施例一中微博社区的页面示意图;

图6为本发明实施例一中图片检索的示意图;

图7为本发明实施例二中社区网站页面的图片检索方法的流程图;

图8为本发明实施例二中图片检索的示意图。

具体实施方式

下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。

为简化用户进行页面输入过程中获取图片的检索操作的复杂度,本发明旨 在让用户文字输入的社区网站页面自动执行图片检索,从而省去用户的操作。

本发明实施例所提供的一种社区网站页面的图片检索方法,如图3所示, 主要包括以下步骤:

步骤301,从社区网站页面获取检索图片的关键词,并根据获取的关键词 在相应的搜索引擎检索图片。

社区网站的客户端可以从社区网站页面的搜索引擎入口提取关键词;也可 以从社区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。 在获取检索图片的关键词后,社区网站的客户端通过搜索引擎从图片资源网站 或图片资源库中抓取图片索引与所述关键词相匹配的图片,作为检索所得的图 片。

较佳的,从社区网站页面获取检索图片的关键词之后,可以对所述关键词 进行归一化处理,如:同义词归一化、纠正错别字等处理;那么,检索图片所 使用的关键词即是经过归一化处理的关键词。

步骤302,将检索所得的图片通过所述社区网站页面进行展示。

检索获得的图片可以按照关键词与图片索引的匹配程度从高到低的顺序进 行排序并展示。

下面以从社区网站页面的搜索引擎入口提取关键词为例,对本发明的图片 检索方法进一步详细阐述。本发明实施例一所提供的一种社区网站页面的图片 检索方法,如图4所示,主要包括以下步骤:

步骤401,从社区网站页面的搜索引擎入口提取关键词,并根据提取的关 键词在相应的搜索引擎检索图片。

在社区网站页面的界面上提供图片搜索的功能,通过社区网站页面上的搜 索引擎入口,用户可以直接提交查询图片的关键词;社区网站的客户端通过搜 索引擎从图片资源网站或图片资源库中抓取图片索引与关键词相匹配的图片, 作为检索所得的图片。以微博社区为例,如图5所示,在微博社区的界面上提 供有搜索引擎入口,用户点击“搜索”按钮即可触发搜索引擎入口,并通过该 入口提交查询图片的关键词;微博社区通过关联的搜索引擎从图片资源网站或 图片资源库中抓取图片索引与关键词相匹配的图片,作为检索所得的图片。搜 索引擎具有索引功能,在搜索引擎中为每个检索的图片建立有图片索引,图片 索引中的词汇来自于图片采集时网页上图片周边的文本。例如:用户提交的关 键词为“太阳”和“月亮”,则微博社区的客户端通过关联的搜索引擎从图片资 源网站或图片资源库中抓取图片索引中包含“太阳”和/或“月亮”图片,作为 检索所得的图片。

步骤402,将检索所得的图片通过社区网站页面进行展示。

仍以微博社区为例,一种较佳的图片检索过程如图6所示,用户通过微博 的搜索引擎入口提交查询图片的关键词,微博对所述关键词进行查询串处理、 也即归一化处理,包括:同义词归一化、纠正错别字等等;然后,根据归一化 处理后的关键词通过关联的搜索引擎从图片资源网站或图片资源库中抓取图片 索引与关键词相匹配的图片,具体的:搜索引擎根据所述关键词通过网络爬虫 (Crawler)从图片资源网站或图片资源库抓取图片,搜索引擎的索引模块为每 个抓取的图片建立有图片索引,图片索引中的词汇来自于图片采集时网页上图 片周边的文本;微博客户端利用所述关键词,结合所述图片索引,对索引中的 图片进行筛选、排序等处理,将检索获得的图片按照关键词与图片索引的匹配 程度(如图片索引与关键词的匹配数量)从高到低的顺序进行排序并通过微博 的界面展示。其中,Crawler是一种自动获取网页内容的程序,是搜索引擎的重 要组成部分。

在上述实施例一中,需要用户主动触发搜索并输入查询的关键词来获取所 需图片;本发明的实施例二提供一种社区网站页面的图片检索方法,根据用户 的输入内容自动进行相关图片的检索和推荐,如图7所示,该方法主要包括以 下步骤:

步骤701,从社区网站页面上的输入文本中抽选特征关键词,并根据抽选 的特征关键词在搜索引擎检索图片。

社区网站的客户端实时地从用户的输入文本中抽选特征关键词,将抽选的 特征关键词送入搜索引擎,搜索引擎从图片资源网站或图片资源库中抓取图片 索引与所述特征关键词相匹配的图片,作为检索所得的图片。

一种较佳的检索方式可以进一步包括:

社区网站的客户端从输入文本T中抽选特征关键词,所述特征关键词的集 合标记为向量W,其中,W={w1,w2,w3,...,wm},wi表示特征关键词i,1 ≤i≤m,m为正整数;

计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性 分值向量标记为F,其中,F={f1,f2,f3,...,fm},fi表示wi的重要性分值, 1≤i≤m,m为正整数;

搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P={p1, p2,p3,...,pn},pj表示图片j,1≤j≤n,n为正整数;图片pj对应的词汇向量 标记为Wj、相应的重要性分值标记为Fj,其中,Wj={w′1,w′2,w′3,...,w′q}, w′k表示pi的索引词汇k,Fj={f′1,f′2,f′3,...,f′q},f′k表示w′k的重要性分值, 1≤k≤q,q为正整数;计算图片pj的推荐分值S(T,pj)=F·Fj,并选取S 最大的一张图片、或S按照从大到小顺序的多张图片(数量根据实际展示的需 要进行设定)作为最终检索所得的图片。

步骤702,将检索所得的图片通过社区网站页面进行展示。

仍以微博社区为例,一种较佳的图片检索过程如图8所示,微博客户端实 时地从用户的输入文本中抽选特征关键词,所述特征关键词的集合标记为向量 W,其中,W={w1,w2,w3,...,wm},wi表示特征关键词i,1≤i≤m,m为 正整数;计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重 要性分值向量标记为F,其中,F={f1,f2,f3,...,fm},fi表示wi的重要性分 值,1≤i≤m,m为正整数;抽选的特征关键词送入到搜索引擎,搜索引擎根据 所述特征关键词通过网络爬虫(Crawler)从图片资源网站或图片资源库抓取图 片,搜索引擎的索引模块为每个抓取的图片建立有图片索引,图片索引中的词 汇来自于图片采集时网页上图片周边的文本;图片检索模块具有图片推荐功能, 将搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P={p1,p2, p3,...,pn},pj表示图片j,1≤j≤n,n为正整数;图片pj对应的词汇向量标 记为Wj、相应的重要性分值标记为Fj,其中,Wj={w′1,w′2,w′3,...,w′q}, w′k表示pi的索引词汇k,Fj={f′1,f′2,f′3,...,f′q},f′k表示w′k的重要性分值, 1≤k≤q,q为正整数;图片检索模块通过计算图片pj的推荐分值S(T,pj)=F·Fj, 选取S最大的一张图片、或S按照从大到小顺序的多张图片作为最终检索所得 的图片,即图片检索模块的一个优化目标函数为:

arg maxP∑S(T,pi),where pi∈P

该函数的含义即为,选择P中S最大的作为最终结果。

对应上述社区网站页面的图片检索的方法,本发明的实施例还提供了一种 社区网站页面的图片检索系统,主要包括:图片检索模块和图片展示模块。其 中,图片检索模块,用于从社区网站页面获取检索图片的关键词,并根据获取 的关键词在相应的搜索引擎检索图片;图片展示模块,用于将检索所得的图片 通过所述社区网站页面进行展示。

较佳的,图片检索模块可用于,通过搜索引擎从图片资源网站或图片资源 库中抓取图片索引与所述特征关键词相匹配的图片,作为检索所得的图片。

较佳的,图片检索模块可进一步用于,从社区网站页面的搜索引擎入口提 取所述关键词;或者,从社区网站页面上的输入文本中抽选特征关键词,作为 检索图片的关键词。

较佳的,图片检索模块可进一步用于,从输入文本T中抽选特征关键词, 所述特征关键词的集合标记为向量W,其中,W={w1,w2,w3,...,wm}, wi表示特征关键词i,1≤i≤m,m为正整数;计算每个特征关键词对所述输入 文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F={f1, f2,f3,...,fm},fi表示wi的重要性分值,1≤i≤m,m为正整数;

将搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P={p1, p2,p3,...,pn},pj表示图片j,1≤j≤n,n为正整数;图片pj对应的词汇向量 标记为Wj,计算相应的重要性分值Fj,其中,Wj={w′1,w′2,w′3,...,w′q}, w′k表示pi的索引词汇k,Fj={f′1,f′2,f′3,...,f′q},f′k表示w′k的重要性分值, 1≤k≤q,q为正整数;通过计算图片pj的推荐分值S(T,pj)=F·Fj,选取S 最大的一张、或S按照从大到小顺序的多张图片作为最终检索所得的图片。

较佳的,图片检索模块可进一步用于,对所获取的关键词进行归一化处理, 并根据归一化处理后的关键词在相应的搜索引擎检索图片。

较佳的,图片展示模块可进一步用于,将检索获得的图片按照关键词与图 片索引的匹配程度从高到低的顺序进行排序并展示。

需要说明的是,本发明的方案不仅仅适用于微博社区的网站,也适用于页 面提供有用户文字输入的任何形式的社区网站和其他类型的网站。通过本发明, 简化了用户进行页面输入过程中获取图片的检索操作,降低了用户进行页面输 入时获取图片的复杂度,提高了输入效率,增加了用户体验。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范 围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号