首页> 中国专利> 将图像分类为广告图像或非广告图像

将图像分类为广告图像或非广告图像

摘要

广告图像分类系统训练二元分类器来将图像分类成广告图像或非广告图像,并随后使用该二元分类器来将网页的图像分类成广告图像或非广告图像。在训练阶段期间,该分类系统生成包括表示图像的特征向量和指示图像是广告图像还是非广告图像的标签的训练数据。该分类系统使用训练数据来训练二元分类器以分类图像。在分类阶段期间,该分类系统输入具有图像的网页并为该图像生成特征向量。该分类系统随后将已训练的二元分类器应用于该特征向量以生成指示图像是广告图像还是非广告图像的分数。

著录项

  • 公开/公告号CN102138151A

    专利类型发明专利

  • 公开/公告日2011-07-27

    原文格式PDF

  • 申请/专利权人 微软公司;

    申请/专利号CN200880019701.2

  • 发明设计人 M·李;Z·李;D·李;B·王;

    申请日2008-06-13

  • 分类号G06Q30/00(20060101);G06K9/66(20060101);

  • 代理机构31100 上海专利商标事务所有限公司;

  • 代理人张政权;钱静芳

  • 地址 美国华盛顿州

  • 入库时间 2023-12-18 02:56:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-05-27

    专利权的转移 IPC(主分类):G06K9/66 变更前: 变更后: 登记生效日:20150507 申请日:20080613

    专利申请权、专利权的转移

  • 2013-05-29

    授权

    授权

  • 2011-09-07

    实质审查的生效 IPC(主分类):G06Q30/00 申请日:20080613

    实质审查的生效

  • 2011-07-27

    公开

    公开

说明书

背景

许多网站的提供者依赖在线广告作为收入的来源。这些提供者可能依赖第三方广告服务器来提供被包括在他们的网站的网页上的广告。在网页被生成时,可在具有引用广告服务器的超链接的网页上分配广告空间。在该网页被浏览器显示时,浏览器通过向广告服务器发送请求来解析该超链接。广告服务器标识合适的广告并将该广告返回浏览器,该广告可以包括到关于正在广告的事物的网页的链接。浏览器随后将该广告显示为网页的一部分。在用户选择该广告的超链接时,网页的提供者可以得到该广告的补偿。

为提高增加收入的机会,网页的提供者可以使网页挤满广告。然而,网页挤满广告可能有负面的结果。例如,诸如手持式个人计算机、蜂窝电话、以及个人数字助理(“PDA”)等移动设备正成为越来越流行的访问因特网的方式。不幸的是,使用这些移动设备来访问具有许多广告的网页的用户体验不令人满意。首先,因为这些移动设备具有小显示区域,难以有效地在此类小显示区域中显示具有许多广告的网页。第二,因为这些移动设备通常具有相对较慢的通信链接(例如,经由蜂窝电话网络),所以下载挤满广告的被访问的网页可花费难以接收的长时间。第三,因为移动设备具有有限的计算能力,所以挤满广告的网页的呈现也可以花费难以接受的长时间。

作为另一示例,许多搜索引擎服务提供对可经由网页访问的图像的搜索。这些搜索引擎服务允许用户搜索用户可能感兴趣的图像。在用户提交包含搜索项的搜索请求(即,查询)之后,搜索引擎服务标识可能与这些搜索项相关的图像。为快速标识相关的图像,搜索引擎服务可维护关键词到图像的映射或索引。该映射可以通过“爬寻(crawl)”web(即,万维网)以标识包含图像的网页的关键词来生成。为爬寻web,搜索引擎服务可使用根网页列表来标识能通过这些根网页访问的所有网页。只要搜索引擎服务标识了网页上的图像,它就将该图像添加到映射。因为网页的许多图像是作为广告的一部分的图像,映射将包含搜索图像的用户通常对其不感兴趣的广告的图像。在存在大量广告的图像时,搜索引擎服务生成映射花费更长的时间;该映射消耗更多的系统资源;访问该映射花费更长的时间;且搜索结果可能包含用户对其不感兴趣的许多广告的图像。

概述

提供了将显示页面的图像作为广告图像或非广告图像的标识。广告图像分类系统训练二元分类器来将图像分类成广告图像或非广告图像并随后使用该二元分类器来将诸如网页等显示页面的图像分类成广告图像或非广告图像。在训练阶段期间,分类系统收集具有图像的网页并标识这些网页的图像。分类系统随后为每一图像输入一标签,以指示该图像是广告图像还是非广告图像。分类系统随后为每一图像生成包含从图像及其网页中导出的特征的特征向量。分类系统训练二元分类器来使用包括特征向量和图像的标签的训练数据来分类图像。在分类阶段期间,分类系统输入具有图像的网页并为该图像生成特征向量。分类系统随后将已训练的二元分类器应用于该特征向量以生成指示图像是广告图像还是非广告图像的分数。

提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。

附图简述

图1是示出在一个实施例中的分类系统的各组件的框图。

图2是示出某些实施例中在生成可视布局特征中使用的各因子的框图。

图3是例示某些实施例中分类系统的生成分类器组件的处理的流程图。

图4是例示某些实施例中分类系统的生成特征向量组件的处理的流程图。

图5是例示某些实施例中分类系统的生成图像特征向量组件的处理的流程图。

图6是例示某些实施例中分类系统的学习相关特征组件的处理的流程图。

图7是例示某些实施例中分类系统的分类图像组件的处理的流程图。

图8是例示某些实施例中分类系统的特征生成组件的处理的流程图。

详细描述

提供了将显示页面的图像作为广告图像或非广告图像的标识。在某些实施例中,广告图像分类系统训练二元分类器来将图像分类成广告图像或非广告图像,并随后使用该二元分类器来将诸如网页等显示页面的图像分类成广告图像或非广告图像。在训练阶段期间,分类系统收集具有图像的网页并标识这些网页的图像。分类系统随后为每一图像输入一标签,以指示该图像是广告图像还是非广告图像。分类系统随后为每一图像生成包含从图像及其网页中导出的特征的特征向量。例如,特征可包括图像的尺寸、图像在网页上的左和顶坐标、其网页上具有相同左坐标的图像的数量、图像的高度等。分类系统训练二元分类器来使用包括特征向量和图像的标签的训练数据来分类图像。分类系统可使用各种技术来训练二元分类器,如支持向量机技术、神经网络技术、贝叶斯技术等。二元分类器在分类图像时可由指示给定每一特征的权重的特征权重来表示。在分类阶段期间,分类系统输入具有图像的网页并为该图像生成特征向量。分类系统随后将二元分类器的权重应用于该特征向量以生成指示图像是广告图像还是非广告图像的分数。二元分类器可被图像搜索引擎服务使用来标识广告图像并在它们被添加到图像的映射之前将这些图像丢弃。二元分类器还可被支持移动设备的服务器使用来在网页被提供给移动设备之前标识并丢弃来自网页的广告图像。

在某些实施例中,分类系统在特征标识阶段期间标识相关于图像作为广告图像或非广告图像的分类的特征。分类系统可随后在训练阶段期间使用这些相关特征。为标识相关特征,分类系统选择要从其中标识相关特征的候选特征。分类系统以类似于上文所述的为训练阶段的方式来为特征标识阶段生成包括特征向量及其标签的训练数据。然而,一个区别可以是在特征标识阶段中使用的特征向量包括所有候选特征,而在训练阶段中使用的特征向量仅包括被确定为相关的候选特征。例如,候选特征可包括指示图像的元数据是否包含单词“广告”的特征和指示图像的尺寸的另一特征。在特征标识阶段期间,分类系统可确定涉及元数据的特征是不相关的而涉及尺寸的特征是相关的。因此,相关特征是候选特征的子集。如果分类系统在特征标识阶段和训练阶段两者中使用相同的网页,则该分类系统可通过从特征标识阶段期间生成的特征向量复制相关特征来为训练阶段生成特征向量。

分类系统随后使用自适应增强技术来使用候选特征的特征向量和标签来训练分类器将图像分类为广告图像或非广告图像。自适应增强技术为每一候选特征生成一弱分类器且学习每一弱分类器的权重。自适应增强技术基于训练数据的误分类来学习这些权重。分类系统随后选择其权重指示它们与图像是广告图像或非广告图像的分类相关的弱分类器的候选特征作为相关特征。例如,分类系统可以选择权重最重的那些弱分类器的候选特征。

在某些实施例中,分类系统将候选特征分类为文本特征、链接特征、可视布局特征、或内容特征。文本特征是从网页中导出的、可以指示该单词是广告的单词(例如,图像的URL、图像的ALT串、或环绕图像的文本)。此类单词包括“弹出”和“广告”。

链接特征从与图像相关联的链接所指向的站点中导出。一个链接特征指示标识图像的超链接是指向提供网页的相同网站,还是指向不同的位置,该不同的位置可以是广告服务器。指向不同位置的此类超链接可指向广告服务器并从而指示该图像是广告。另一链接特征指示与图像相关联的超链接是指向提供网页的相同网站还是指向不同的位置,该不同的位置可以是通过其可购买被广告的商品的网页。指向不同位置的此类超链接可能是指向广告客户的网页的并因此指示该图像是广告。

可视布局特征涉及图像如何在其网页内被可视地布局。可视布局特征可包括图像的最左坐标、图像的高度、其网页中具有相同最左坐标的图像的数量等。各种特征可被规范化为网页的宽度和高度。例如,网页的X-坐标和Y-坐标可在0到1之间的范围内。

内容特征涉及图像本身的内容。内容特征可包括图像的纵横比、图像格式、图像是照片还是图形、图像的尺寸、图像的不同色彩数量、图像的灰色区域的百分比、以及图像是否具有高对比度的指示。纵横比特征在标识又短又宽的横幅广告中可以是有用的。图像格式特征在标识可带有具有多个框架的格式的广告图像中可以是有用的。照片/图形特征可以是有用的,因为许多广告图像是包含广告的信息的图形。尺寸特征可以是有用的,因为广告图像需要大到足以被注意。颜色数量特征可以是有用的,因为广告图像与非广告图像相比通常具有的不同颜色较少。灰色百分比特征可以是有用的,因为广告图像通常具有不同的灰度作为背景。对比度特征可以是有用的,因为广告图像被手动创建以具有尖锐的对比度。

下表列出在一个实施例中被标识为相关的候选特征。排名指示在特征标识阶段期间被分配给特征的弱分类器的权重的排序。C1表示文本特征,C2表示链接特征,C3表示可视布局特征,而C4表示内容特征。

  排  名  类别  特征描述  1  C4  图像的尺寸  2  C3  图像右侧的X-坐标  3  C3  图像的宽度  4  C1  在广告中、也在图像URL中的单词的数量

  5  C3  图像顶部的Y-坐标  6  C3  图像中心的Y-坐标  7  C4  图像的对比度  8  C4  图像是照片还是图形  9  C3  图像中心的X-坐标  1  0  C4  图像的灰色百分比  1  1  C1  在广告中、也在与图像相关联的URL中的单词的数量  1  2  C3  图像左侧的X-坐标  1  3  C3  与该图像具有相同X-坐标的图像的数量  1  C3  与该图像具有相同X-坐标和宽度的图像的数量  4  1  5  C3  图像底部的Y-坐标  1  6  C3  与图像具有相同维度的图像的数量  1  7  C3  图像的高度  1  8  C3  与图像具有相同Y-坐标和高度的图像的数量  1  9  C2  图像URL是否指向服务站点之外的站点  2  0  C2  图像是否具有指向服务站点之外的站点的超链接

如上所述,自适应增强技术可用于标识与图像为广告图像或非广告图像的分类相关的那些候选特征。自适应增强是在具有示例的训练数据的集合上运行多次测试的迭代过程。自适应增强将弱学习算法(仅以比偶然性稍好的水平执行的算法)变换成强学习算法(显示低出错率的算法)。弱学习算法可以在训练数据的不同子集上运行。该算法越来越专注于其前任倾向于显示错误的那些示例。该算法校正由早先的弱学习算法所造成的错误。因为其调整其前任的出错率,因此该算法是自适应的。自适应增强组合粗略和适度地不准确的经验法则以创建高性能算法。自适应增强将各独立运行的测试的结果组合成单个、非常准确的分类器或排序功能。

如上所述,分类可使用支持向量机来通过使用被标识为相关的特征来训练二元分类器。支持向量机通过在可能的输入的空间中寻找超曲面来操作。超曲面尝试通过最大化正示例(例如,广告图像标签的特征向量)和负示例(例如,具有非广告标签的特征向量)中最接近的一个与超曲面之间的距离而将正示例与负示例分开。这允许相似于但不同于训练数据的数据的正确的分类。可使用多种技术训练支持向量机。一种技术使用将较大的二次编程问题分解成一系列可被分析求解的较小的二次编程问题的顺序最小优化算法。(参见在http://research.microsoft.com/~jplatt/smo.html上的顺序最小优化。)

图1是示出在一个实施例中的分类系统的各组件的框图。分类系统110经由通信链接130连接到web服务器140、搜索引擎爬寻器150、移动设备服务器160、以及用户计算设备187。Web服务器可供应由搜索引擎爬寻器爬寻且由用户计算设备访问的网页。移动设备服务器向移动设备供应网页。分类系统包括训练图像存储111、训练数据存储112、相关特征存储113、以及分类权重存储114。训练图像存储包含具有用于训练二元分类器的图像的网页。训练数据存储包含训练图像存储的图像的特征向量和标签。特征向量可包括所有候选特征。相关特征存储包含在特征标识阶段期间被确定为相关的那些候选特征的指示。分类权重存储包含表示已训练的二元分类器的权重。

分类系统还包括生成分类器组件121、生成特征向量组件122、生成图像特征向量组件123、学习相关特征组件124、以及各种生成特征组件125。生成分类器组件调用生成特征向量组件来生成训练图像存储的图像的特征向量。生成特征向量组件调用生成图像特征向量组件来生成图像的特征向量。生成图像特征向量组件调用生成特征组件来生成特征向量的特征。生成分类器组件随后训练二元分类器来学习分类权重。生成分类器组件还可以调用学习相关特征组件来通过使用自适应增强技术从候选特征中标识相关特征。

分类系统还包括将网页的图像分类为广告图像或非广告图像的分类图像组件126。该分类图像组件调用生成图像特征向量组件来生成要被分类的图像的特征向量。分类图像组件随后将分类权重应用于该特征向量以分类该图像。

在其上实现分类系统的计算设备可包括中央处理单元、存储器、输入设备(例如,键盘和定点设备)、输出设备(例如显示设备)和存储设备(例如,盘驱动器)。存储器和存储设备是可以用实现该系统的计算机可执行指令来编码的计算机可读介质,这表示包含该指令的计算机可读介质。此外,指令、数据结构和消息结构可被存储或经由诸如通信链路上的信号之类的数据传送介质传送。可以使用各种通信链路,如因特网、局域网、广域网、点对点拨号连接、蜂窝电话网络等。

该分类系统的实施例可以在各种操作环境中实现或结合各种操作环境来使用,这些操作环境包括个人计算机、服务器计算机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、可编程消费者电子产品、数码相机、网络PC、小型计算机、大型计算机、蜂窝电话、个人数字助理、智能电话、个人计算机、可编程消费电子设备、包括任何上述系统或设备中任一种的分布式计算环境等。

分类系统可以在由一个或多个计算机或其他设备执行的诸如程序模块等计算机可执行指令的通用上下文中描述。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。通常,程序模块的功能可以在各个实施例中按需进行组合或分布。例如,特征标识阶段、训练阶段、以及分类阶段可在不同计算系统上执行。二元分类器可被分发到各种搜索引擎服务、移动设备服务器、或可能需要标识广告图像的其它计算设备。

图2是示出某些实施例中、在生成可视布局特征中使用的因子的框图。网页200包括图像201。该网页具有为1的规范化网页宽度202和为1的规范化网页高度203。X-坐标和Y-坐标在0到1之间变化。图像的位置204由该图像左上角的X-坐标和Y-坐标来表示。图像中心205由图像中心点的X-坐标和Y-坐标来表示。将图像宽度206和图像高度207规范化为网页的宽度和高度。

图3是例示某些实施例中分类系统的生成分类器组件的处理的流程图。在执行训练阶段之前的特征标识阶段期间,该生成分类器组件可任选地从候选特征中学习相关特征。在训练阶段期间,该组件使用包括相关特征的特征向量和标签的训练数据来训练二元分类器。在框301,组件将训练图像存储的图像标记为是广告图像或是非广告图像。在框302,组件调用生成特征向量组件以传递候选特征来为所有图像生成特征向量。在框303,组件调用学习相关特征组件以学习哪个候选特征是相关的。在框304,该组件调用生成特征向量组件来生成图像的相关特征的特征向量。本领域的技术人员可以理解,可从包括候选特征的特征向量中提取相关特征,因为相关特征是候选特征的子集(假设在特征标识阶段和训练阶段期间使用相同的图像)。在框305,组件通过使用支持向量机算法或某一其它机器学习算法来使用相关特征的特征向量和标签来训练二元分类器。在框306,组件将所学习到的特征的权重存储在分类权重存储中并随后完成。

图4是例示某些实施例中分类系统的生成特征向量组件的处理的流程图。向该组件传递了特征的列表(例如,候选特征或相关特征),该组件并为每一包含这些特征的图像生成特征向量。在框401,组件选择训练图像存储的下一图像。在判定框402,如果已经选择了所有图像,则该组件返回,否则该组件在框403处继续。在框403,组件调用生成图像特征向量组件以传递所选图像和特征来生成所选图像的特征向量。在框404,该组件将图像的特征向量存储在训练数据存储中,并随后循环至框401以选择下一图像。

图5是例示某些实施例中分类系统的生成图像特征向量组件的处理的流程图。向该组件传递图像和特征的列表。该组件生成包含被传递的特征的图像的特征向量。在框501,该组件选择下一被传递的特征。在判定框502,如果已经选择了所有特征,则该组件返回特征向量,否则该组件在框503处继续。在框503,该组件通过调用合适的生成特征组件来生成图像的所选特征。在框504,该组件将所生成的特征添加到图像的特征向量,并随后循环至框501以选择下一特征。

图6是例示某些实施例中分类系统的学习相关特征组件的处理的流程图。该组件通过使用训练数据存储的训练数据来标识相关特征,并将相关特征的指示存储在相关特征存储中。该组件标识与将图像分类为广告图像或非广告图像有关的那些候选特征。在框601,该组件将相等的权重分配给图像。在自适应增强过程期间,调整图像的权重以便训练可聚焦于基于弱分类器的权重而被误分类的那些图像。在框602-608,组件循环确定弱分类器的权重并调整误分类图像的权重。在框602,该组件递增到下一迭代。在判定框603,如果所有迭代完成,则该组件在框609处继续,否则该组件在框604处继续。在框604-606,该组件为每一特征循环训练一弱分类器。在框604,该组件选择下一特征。在判定框605,如果已选择了所有特征,则该组件继续至框607,否则该组件继续至框606。在框606,该组件通过使用图像的权重来训练用于所选特征的弱分类器。该组件随后循环至框604以选择下一个特征。在框607,该组件选择最佳弱分类器,即,具有最少误分类的弱分类器。在框608,该组件基于所选弱分类器的误分类来调整图像的权重。相对于被正确分类的图像增加了被误分类的图像的权重。该组件随后循环至框602以递增到下一迭代。在框609,该组件选择最佳弱分类器的特征并随后将该所选特征作为相关特征返回。

图7是例示某些实施例中分类系统的分类图像组件的处理的流程图。向该组件传递了包含图像的网页并返回该图像是广告图像还是非广告图像的指示。在框701,该组件调用生成图像特征向量组件来生成图像的特征向量。在框702,该组件通过将分类权重存储的权重应用于特征向量的特征来生成分类分数。在判定框703,如果分数指示图像是广告,则该组件返回广告图像的指示,否则该组件返回非广告图像的指示。

图8是例示某些实施例中分类系统的特征生成组件的处理的流程图。在此示例中,特征生成组件生成网页中具有与该图像相同的最左X-坐标的图像的数量。在框801,该组件检索该图像的最左X-坐标。在框802,该组件初始化该计数。在框803-807,该组件循环确定网页中的每一其它图像是否具有该相同的最左X-坐标。在框803,该组件选择网页的下一其它图像。在判定框804,如果已经选择了所有其它图像,则该组件返回计数,否则该组件在框805处继续。在框805,该组件检索所选其它图像的最左X-坐标。在判定框806,如果X-坐标是相同的,则该组件在框807继续,否则该组件循环至框803以选择下一其它图像。在框807,该组件递增该计数,并随后循环至框803以选择下一其它图像。

尽管用对结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求的示例形式公开的。因此,本发明只由所附权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号