首页> 中国专利> 元数据标签描述的生成

元数据标签描述的生成

摘要

本公开的实施例涉及元数据标签描述的生成。提供了用于元数据标签评估的一个或多个技术和/或系统。例如,可以标识与内容相关联的元数据标签(例如,可以使用主题标签#ML来标记社交网络帖子)。可以利用概率矩阵和内容来评估上述内容内的一组字符,以标识经扩展的元数据标签(例如,经扩展的主题标签“机器学习”)。可以检索与经扩展的元数据标签相关联的描述性内容,诸如网站、文章、社交网络帖子和/或其他内容。可以基于描述性内容(例如,用于机器学习的定义)来生成元数据标签的描述。以这种方式,可以将描述、相关元数据标签和/或补充内容提供给有兴趣了解元数据标签的用户。

著录项

  • 公开/公告号CN112905864A

    专利类型发明专利

  • 公开/公告日2021-06-04

    原文格式PDF

  • 申请/专利权人 微软技术许可有限责任公司;

    申请/专利号CN202110184258.1

  • 发明设计人 S·N·班努尔;O·阿隆索;M·亨切尔;

    申请日2016-06-01

  • 分类号G06F16/907(20190101);G06F16/908(20190101);G06F16/78(20190101);G06F16/9535(20190101);G06N20/00(20190101);

  • 代理机构11256 北京市金杜律师事务所;

  • 代理人罗利娜

  • 地址 美国华盛顿州

  • 入库时间 2023-06-19 11:16:08

说明书

本申请是申请日为2016年6月1日、申请号为201680032277.X,发明名称为“元数据标签描述的生成”的发明专利申请的分案申请。

背景技术

很多用户可以利用元数据标签来标记各种内容。在一个示例中,用户可以利用主题标签#myvacation来标记度假照片。在另一示例中,用户可以利用主题标签#atthebaseballgame来标记关于棒球比赛的社交网络消息。很多时候,元数据标签可能使用首字母缩略词(例如,用于“thank goodness it’s Friday”的#tgif)或者新创建的术语(例如,用于在电视上刚刚首播的“Dancing with Friends show”的#DWFS)进行标记,某些用户可能无法辨识这些标签。

发明内容

提供发明内容部分是为了以简化的形式介绍将在以下具体实施方式部分中进一步描述的一些概念。发明内容部分无意标识所要求保护的主题的关键因素或重要特征,也无意限制所要求保护的主题的范围。

除了其他之外,本文中提供了用于元数据标签评估的一个或多个系统和/或技术。在元数据标签评估的示例中,标识与内容相关联的元数据标签。元数据标签包含一组字符。利用概率矩阵和上述内容来评估该组字符,以标识经扩展的元数据标签。检索与经扩展的元数据标签相关联的描述性内容。基于描述性内容来生成元数据标签的描述。在一个示例中,接收包括元数据标签的查询。经扩展的元数据标签被标识为元数据标签的扩展。提供元数据标签的描述作为查询的查询结果。

为了实现前述和相关目的,以下描述和附图阐述了某些说明性方面和实现。这些仅指示一个或多个方面可以采用的各种方式中的几种。结合附图考虑下文的具体实施方式,本公开的其他方面、优点和新颖特征将变得清楚。

附图说明

图1是示出元数据标签评估的示例性方法的流程图。

图2是示出用于元数据标签评估的示例性系统的部件框图,其中元数据标签的描述被生成。

图3是示出用于元数据标签评估的示例性系统的部件框图,其中元数据标签的描述被生成。

图4是示出用于元数据标签评估的示例性系统的部件框图,其中元数据标签的描述被提供为查询结果。

图5是示例性计算机可读介质的图示,其中可以包括被配置为实现本文中阐述的一个或多个规定的处理器可执行指令。

图6示出了其中可以实现本文中阐述的一个或多个规定的示例性计算环境。

具体实施方式

现在参考附图来描述所要求保护的主题,其中相同的附图标记通常始终用于指代相同的元素。在以下描述中,出于解释的目的,阐述了很多具体细节,以提供对所要求保护的主题的理解。然而,将清楚的是,可以在没有这些具体细节的情况下实践所要求保护的主题。在其他情况下,为了便于描述所要求保护的主题,以框图形式示出了结构和设备。

本文中提供了用于元数据标签评估的一个或多个技术和/或系统。用户可能希望获得元数据标签的描述(例如,与“New TV Show Sitcom”的首字母缩略词相对应的其他非自身可标识的主题标签的描述、诸如#NTVSC的描述)、与元数据标签相关联的补充内容(例如,“New TV Show Sitcom”的图像和/或预告片)和/或相关元数据标签(例如,与“New TVShow Sitcom”中的演员对应的#JohnDoe)。因此,如本文中提供的,元数据标签评估部件可以评估元数据标签以生成元数据标签的描述,标识元数据标签的补充内容和/或元数据标签的相关元数据标签。元数据标签评估部件可以以有效的方式评估元数据标签,从而可以基于元数据标签评估来向用户提供描述、补充内容和/或相关元数据标签。在一个示例中,元数据标签评估部件可以被本地托管在客户端设备上,并且因此可以减轻带宽利用和/或保护用户信息的隐私,用户信息诸如是社交网络帖子、日历条目、照片、消息和/或其他内容(例如,用户已经给出内容供元数据标签评估使用的那些内容)。在另一示例中,元数据标签评估部件可以被托管在远程服务器上,并且因此可以减轻客户端侧存储器和/或处理器利用。在一个示例中,元数据标签评估部件中的至少一些可以被本地托管,并且元数据标签评估部件中的至少一些可以被远程托管。可以理解,用户可以采取肯定的动作,诸如提供选定同意,来允许访问和/或使用内容、信息、数据等(例如,社交网络帖子、日历条目、照片、消息等),诸如用于评估元数据标签的目的(例如,在这种情况下,在用户对关于收集和/或使用这样的信息的提示进行响应)。例如,社交网络的用户可以通过社交网络账户设置来指定(例如,由用户在社交网络帖子中使用的)元数据标签和/或其他社交网络内容可以出于生成这样的元数据标签的描述这样的目的而被使用。

元数据标签评估的实施例由图1的示例性方法100示出。在102,该方法开始。在104,可以标识与内容相关联的元数据标签,其中元数据标签包括一组字符。元数据标签可以包括内容的主题标签(hashtag)或任何其他描述性标识符。内容可以包括可以与元数据标签相关联的社交网络帖子、微博消息、图像、视频、用户评论、网站、文章、消息和/或各种其他内容。在一个示例中,用户可以使用元数据标签#V4JIM来标记社交网络帖子“Everyoneshould vote for Jim in the upcoming presidential election”。然而,很多用户可能不理解元数据标签#V4JIM的含义,并且因此可能有利的是,对元数据标签#V4JIM进行评估,以生成元数据标签#V4JIM的描述。

在106,可以使用概率矩阵和内容来评估该组字符,以标识经扩展的元数据标签。概率矩阵可以表示:以该组字符内的字符开始的术语或词语出现在元数据标签的扩展内的可能性/概率,和/或包括以该组字符内的字符开始的术语或词语的短语将出现在元数据标签的扩展内的可能性/概率。在一个示例中,概率矩阵可以是分词算法的定制,其中可能性/概率被限制为用于元数据标签的内容(例如,概率可以基于社交网络帖子、文章和/或包括元数据标签的各种其他内容内的文本),和/或其中元数据标签内的首字母缩略词基于标识可能的(例如,最有可能的)扩展而被扩展,对可能的扩展的标识基于内容内的文本(例如,文本“Everyone should vote for Jim in the upcoming presidential election”)。概率矩阵可以基于内容和/或与元数据标签相关联的其他内容中出现的文本和/或特征(例如,从文章、图像、视频等中提取的特征)来被填充。

在一个示例中,可以基于以下来为第一字符“V”标识第一术语:第一术语在频率概率矩阵内具有在阈值(例如,用于“V”的最高频率概率)以上的第一频率概率。例如,可以为第一字符“V”标识术语“vote”。可以基于以下来为第二字符“4”标识第二术语:第二术语在频率概率矩阵内具有在阈值(例如,用于“4”的最高频率概率)以上的第二频率概率。例如,可以为第二字符“4”标识术语“for”。基于对第三字符“J”、第四字符“I”和第五字符“M”的评估,可以利用概率矩阵标识第三术语“Jim”。基于包括第一术语、第二术语和第三术语的短语“vote for Jim”在概率矩阵内具有在短语阈值以上的短语频率概率,可以标识该短语,以将该短语包括在经扩展的元数据标签内,该短语阈值例如是最高短语频率概率,该最高短语频率概率指示第一术语、第二术语和第三术语在元数据标签的扩展内一起出现的相对较高可能性。可以理解,可以对照概率矩阵来标识和评估多个术语候选和/或短语候选,以标识元数据标签的扩展。以这种方式,经扩展的元数据标签可以被标识为“vote for Jim”。

在108,可以检索与经扩展的元数据标签“vote for Jim”相关联的描述性内容。例如,可以检索Jim的互联网百科全书描述、投票网站、Jim的社交网络简档、Jim的图像、Jim的政治演讲的视频、和/或各种其他描述性内容。在110,可以基于描述性内容来生成元数据标签的描述。在一个示例中,可以从描述性内容中提取描述性短语,诸如从Jim的社交网络简档中提取的描述性短语“Jim was born in Ohio in 1952,and is currently runningfor president of the United States”。响应于描述性短语“Jim was born in Ohio in1952,and is currently running for president of the United States”在至少一些描述性内容(例如,图像、视频、投票网站,竞选电子邮件、Jim的互联网百科全书描述等)内出现达阈值以上和/或与这些描述性内容基本匹配达阈值以上,可以将描述性短语包括在元数据标签#V4JIM的描述中。例如,如果短语“Jim was born in Ohio in 1952,and iscurrently running for president of the United States”和/或被确定为与该短语足够相似的短语(例如,在某个阈值以上,在一些参数(例如,字数)内,等等)在Jim的社交网络简档和/或其他描述性内容(例如,与Jim相关的图像、视频、在线文本等)中出现超过阈值的次数,则描述性短语可以被包括在元数据标签#V4JIM的描述中。

在一个示例中,基于与经扩展的元数据标签相关联的描述性内容的文本和/或特征,可以生成第一描述候选(“Jim was born in Ohio,is 5feet tall,and is runningfor class president”)以及第二描述候选(例如,“Jim was born in Alabama,is 6feettall,and is running for president”)作为元数据标签的潜在描述。由于描述性候选可能不包括衔接性或一致性描述,所以可以将描述性候选提供给用户用于评估(例如,利用众包技术)。可以接收对第一描述性候选或第二描述性候选的用户选择,用于在生成元数据标签的描述时使用(例如,基于用户选择,选择第一描述性候选或第二描述性候选而不是剩余的描述性候选)。

在一个示例中,可以标识与经扩展的元数据标签相对应的补充内容。补充内容可以包括图像(例如,Jim发表演讲的照片)、视频(例如,Jim在游行中的视频)、Jim的社交网络简档、关键词(例如,可以由用户用于通过搜索界面来定位关于Jim的更多信息的竞选标语)、网站、关于从应用商店可下载的应用(例如,投票应用)的应用建议、广告(例如,Jim的竞选广告)等。在一个示例中,补充内容可以被标识为热门图像、热门视频、热门文章和/或任何其他热门内容,这些热门内容例如可以被与元数据标签相关联的社交网络内容(例如,使用元数据标签标记的图像的社交网络帖子)所引用。

在一个示例中,可以检索包括元数据标签的第二内容。例如,可以检索用户利用#V4JIM元数据标签所标记的文章。可以评估第二内容(诸如文章的文本或主题标签),以标识与元数据标签相关的相关元数据标签。例如,用于标记文章的主题标签#Jim4Prez可以被标识为相关元数据标签。

在一个示例中,可以将经扩展的元数据标签确定为与垃圾内容或露骨内容相对应。例如,可能实际不存在Jim竞选总统,而恶意来源可能正在谋求对假冒竞选的竞选贡献。因此,元数据标签和/或描述可以被标记为垃圾内容和/或露骨内容。

以这种方式,可以基于对元数据标签的评估来标识经扩展的元数据标签、描述、补充内容、相关元数据标签、垃圾内容和/或露骨内容。这样的信息可以被提供给用户,使得这样的用户可以学习元数据标签的定义,探索补充内容,获知相关元数据标签,和/或接收垃圾内容和/或露骨内容的警告。例如,可以接收包括元数据标签的查询(例如,用户可以提交查询“what is#V4JIM”)。可以将经扩展的元数据标签“vote for Jim”标识为元数据标签#V4JIM的扩展。因此,可以提供经扩展的元数据标签、描述、补充内容、相关元数据标签、警告等,以作为该查询的查询结果。

在一个示例中,元数据标签的描述可以被存储在数据结构(例如,数据库等)内。因为随着时间推移,元数据标签可能具有不同的含义,所以可以为元数据标签生成多个描述,并且可以基于与如下时间范围相对应的时间标识符来将多个描述存储在数据结构中,在这些时间范围期间描述用于描述元数据标签。例如,元数据标签#XFL可以在第一时间范围(例如,在2001年期间,这是XFL在运营的唯一一年)期间代表Xtreme Football League,并且因此可以根据元数据标签#XFL标识经扩展的元数据标签Xtreme Football League。可以基于与第一时间范围相关联的Xtreme Football League描述性内容,为元数据标签#XFL生成Xtreme Football League描述。与Xtreme Football League描述用于描述元数据标签#XFL的第一时间范围相对应的第一时间标识符可以与Xtreme Football League描述相关联。Xtreme Football League描述可以基于第一时间标识符而被存储在数据结构内。可以基于与第二时间范围相关联的第二经扩展的元数据标签和第二描述性内容,生成元数据标签的第二描述。例如,可以基于与第二时间范围(例如,从2011赛季跨越到当前赛季的时间范围)相关联的第二经扩展的元数据标签Extreme Fishing League和Extreme Fishing League描述性内容,为元数据标签#XFL生成Extreme Fishing League描述。与Extreme FishingLeague描述用于描述元数据标签#XFL的第二时间范围相对应的第二时间标识符可以与Extreme Fishing League描述相关联。Extreme Fishing League描述可以基于第二时间标识符而被存储在数据结构内。在一个示例中,各种描述可以沿着时间线(例如,基于相关联的时间标识符)而被存储,该时间线可以被呈现给用户,使得用户可以更好地理解、利用这样的描述和/或消除这些描述的歧义(例如,这些描述如何随着时间而发展)。应当理解,与元数据标签相关的任何信息(例如,不仅仅是描述)可以类似地与时间标识符(例如,经扩展的元数据标签、补充内容、相关元数据标签、警告等)相关联。

可以理解,可以以各种方式提供元数据标签的描述(例如,嵌入在使用元数据标签标记的内容内;被提供作为搜索结果;等等)。在一个示例中,当元数据标签被用于标记内容时(例如,当用户创作利用元数据标签#XFL标记的社交网络帖子时),该描述可以与内容一起被提供(例如,可以通过与社交网络帖子相关联的用户界面元素(诸如按钮)提供用于查看Extreme Fishing League描述的选项;Extreme Fishing League描述可以与元数据标签#XFL在一列内,诸如在元数据标签#XFL之前显示(例如,“Extreme Fishing League#XFL”)或者在元数据标签#XFL之后显示(例如,“XFL Extreme Fishing League”);当用户将光标悬停在元数据标签#XFL上方时,Extreme Fishing League描述可以显示为说明文字或弹出窗口;等等)。在112,该方法结束。

图2示出了用于元数据标签评估的系统200的示例。系统200包括元数据标签评估部件204。元数据标签评估部件204可以标识与内容相关联的元数据标签#TGIBF 222,诸如与“heading to a pub on Main street for drinks tonight”有关的社交网络帖子202。元数据标签#TGIBF 222可以包括一组字符T、G、I、B和F。元数据标签评估部件204可以利用概率矩阵206来评估该组字符T、G、I、B和F,以标识经扩展的元数据标签208。例如,术语“thank”可以被标识为在概率矩阵206内具有在用于字符“T”的阈值以上的第一概率,术语“goodness”可以被标识为在概率矩阵206内具有在用于字符“G”的阈值以上的第二概率,术语“it’s”可以被标识为在概率矩阵206内具有在用于字符“I”的阈值以上的第三概率,术语“blue”可以被标识为在概率矩阵206内具有在用于字符“B”的阈值以上的第四概率,并且术语“Friday”可以被标识为在概率矩阵206内具有在用于字符“F”的阈值以上的第五概率。可以理解,对于一个字符,可以考虑多种术语(例如,术语“thank”、术语“the”、术语“taste”、术语“towel”等),并且概率矩阵206(其可以基于诸如社交网络帖子202内的文本等内容)可以用于标识如下的术语:对于该字符,该术语具有相对较高的可能性会频繁出现,和/或该术语具有相对较高的可能性会频繁出现作为一个短语的一部分,该短语还具有为该组字符内的其他字符所标识的其他术语(例如,术语“thank”和术语“goodness”在元数据标签222的扩展中一起出现的概率较高)。以这种方式,可以利用概率矩阵206来标识“thankgoodness it’s blue Friday”的经扩展的元数据标签208。

元数据标签评估部件204可以从描述性内容源210中检索描述性内容,诸如一组描述性内容212。描述性内容可以包括文章、互联网百科全书描述、社交网络帖子、和/或可以描述经扩展的元数据标签208的各种内容。可以评估描述性内容以生成元数据标签#TGIBF222的描述214。例如,描述性短语(例如,“the day before the big Seattle footballteam game.It was made official by declaring it…”)可以从网站中被提取。基于描述性短语在该组描述性内容212内出现达阈值以上(例如,在社交网络帖子、网站和/或其他内容的阈值数量或百分比以内),可以将该描述性短语包括在描述214内。元数据标签评估部件204可以基于用于标记该组描述性内容212内的描述性内容的元数据标签(这可以指示这些元数据标签可以与元数据标签#TGIBF 222和/或经扩展的元数据标签208相关),标识诸如#football、#Seattle等相关元数据标签216。元数据标签评估部件204可以从补充内容源218检索补充内容220。例如,可以检索与元数据标签#TGIBF 222和/或经扩展的元数据标签208相关的图像、视频、社交网络简档、应用建议、广告和/或其他内容。以这种方式,元数据标签评估部件204评估元数据标签#TGIBF 222,以便生成描述214,标识相关元数据标签216,和/或检索补充内容220,这些描述、标签和/或内容可以被提供给有兴趣进一步了解元数据标签#TGIBF 222的用户。

图3示出了用于元数据标签评估的系统300的示例。系统300包括元数据标签评估部件304。元数据标签评估部件304可以标识与内容相关联的元数据标签#DWFS 322,前述内容诸如是询问其他用户是否要观看今晚的节目的社交网络帖子302。元数据标签#DWFS 322可以包括一组字符D、W、F和S。元数据标签评估部件304可以利用概率矩阵306来评估该组字符D、W、F和S以标识经扩展的元数据标签308。例如,术语“dancing”可以被标识为在概率矩阵306内具有在用于字符“D”的阈值以上的第一概率,术语“with”可以被标识为在概率矩阵306内具有在用于字符“W”的阈值以上的第二概率,术语“friends”可以被标识为在概率矩阵306内具有在用于字符“F”的阈值以上的第三概率,并且术语“show”可以被标识为在概率矩阵306内具有在用于字符“S”的阈值以上的第四概率。可以理解,对于一个字符,可以考虑多种术语(例如,术语“desk”、术语“dog”、术语“Dave”、术语“dogwood”等),并且概率矩阵306(其可以基于诸如社交网络帖子302内的术语等内容)可以用于标识如下的术语:针对该字符,该术语具有相对较高的可能性会频繁出现,和/或该术语具有相对较高的可能性会频繁出现作为一个短语的一部分,该短语还具有为该组字符内的其他字符所标识的其他术语(例如,术语“dancing”和术语“show”在元数据标签322的扩展中一起出现的概率较高)。以这种方式,可以利用概率矩阵306来标识“Dancing with Friends show”的经扩展的元数据标签308。

元数据标签评估部件304可以从描述性内容源310中检索描述性内容,诸如一组描述性内容312。描述性内容可以包括文章、互联网百科全书描述、社交网络帖子、电视网站、照片、和/或可以描述经扩展的元数据标签308的各种内容。可以评估描述性内容以生成元数据标签#DWFS322的描述314。例如,描述性短语(例如,“Dancing with Friends is adance competition show airing since 2008.It airs on…”)可以从电视网站被提取。基于描述性短语在该组描述性内容312内出现达阈值以上(例如,在社交网络帖子、网站和/或其他内容的阈值数目或百分比以内),可以将该描述性短语包括在描述314内。元数据标签评估部件304可以基于用于标记该组描述性内容312内的描述性内容的元数据标签(这可以指示这些元数据标签可以与元数据标签#DWFS 322和/或经扩展的元数据标签308相关),标识诸如#dancing、#channel2等相关元数据标签316。元数据标签评估部件304可以从补充内容源318检索补充内容320。例如,可以检索与元数据标签#DWFS322和/或经扩展的元数据标签308相关的图像、视频、社交网络简档、应用建议、广告和/或其他内容。以这种方式,元数据标签评估部件304评估元数据标签#DWFS 322,以便生成描述314,标识相关元数据标签316,和/或检索补充内容320,这些描述、标签和/或内容可以被提供给有兴趣进一步了解元数据标签#DWFS 322的用户。

图4示出了系统400的示例,该系统400用于提供针对查询410的包括元数据标签408的查询结果418。系统400包括元数据标签评估部件402。元数据标签评估部件402可以与元数据标签储存库404相关联,在该元数据标签储存库404中可以存储、索引和/或标识元数据标签的描述、相关元数据标签、和/或与元数据标签和/或元数据标签的扩展相关的补充内容。元数据标签评估部件402可以与用户的客户端设备可访问的搜索界面406(例如,基于web的搜索引擎界面)相关联。用户可以在搜索界面406内提交包括元数据标签#DWFS 408的查询410,以尝试更好地理解#DWFS的含义。

元数据标签评估部件402可以接收查询410。元数据标签评估部件402可以确定经扩展的元数据标签“Dancing with Friends show”可以是的元数据标签#DWFS 408的扩展。元数据标签评估部件402可以(例如,基于经扩展的元数据标签)从元数据标签储存库404中检索元数据标签408的描述412、与元数据标签408相关的相关元数据标签414、和/或该元数据标签的补充内容416。元数据标签评估部件402可以通过搜索界面406来为查询410提供搜索结果418。例如,搜索结果418可以包括描述412“dancing with Friends is a dancecompetition show airing since 2008.It airs on…”、相关元数据标签#dancing和#channel2 414、和/或补充内容416,补充内容416包括与元数据标签408#DFSFS相关的图像、视频、社交网络简档、应用建议、广告和/或其他内容。

根据本公开的一方面,提供了一种用于元数据标签评估的方法。该方法包括标识与内容相关联的元数据标签。该元数据标签可以包括一组字符。可以利用概率矩阵和内容来评估该组字符,以标识经扩展的元数据标签。可以检索与经扩展的元数据标签相关联的描述性内容。可以基于描述性内容来生成元数据标签的描述。

根据本公开的一方面,提供了一种用于元数据标签评估的系统。该系统包括元数据标签评估部件。元数据标签评估部件可以被配置成标识与内容相关联的元数据标签。元数据标签可以包括一组字符。元数据标签评估部件可以被配置为利用概率矩阵和内容来评估该组字符,以标识经扩展的元数据标签。元数据标签评估部件可以被配置为检索与经扩展的元数据标签相关联的描述性内容。元数据标签评估部件可以被配置为基于描述性内容来生成元数据标签的描述。

根据本公开的一方面,提供了一种包括指令的计算机可读介质,这些指令在被执行时执行用于元数据标签评估的方法。该计算机可读介质包括标识与内容相关联的元数据标签。元数据标签可以包括一组字符。可以利用概率矩阵和内容来评估该组字符,以标识经扩展的元数据标签。可以检索与经扩展的元数据标签相关联的描述性内容。可以基于描述性内容来生成元数据标签的描述。可以接收包括元数据标签的查询。可以将经扩展的元数据标签标识为元数据标签的扩展。可以提供元数据标签的描述作为查询的查询结果。

根据本公开的一方面,提供了一种用于元数据标签评估的装置。可以通过用于元数据标签评估的装置来标识与内容相关联的元数据标签。元数据标签可以包括一组字符。可以通过用于元数据标签评估的装置利用概率矩阵和内容来评估该组字符以标识经扩展的元数据标签。可以通过用于元数据标签评估的装置来检索与经扩展的元数据标签相关联的描述性内容。可以通过用于元数据标签评估的装置,基于描述性内容来生成元数据标签的描述。

根据本公开的一方面,提供了一种用于元数据标签评估的装置。可以通过用于元数据标签评估的装置来标识与内容相关联的元数据标签。元数据标签可以包括一组字符。可以通过用于元数据标签评估的装置,利用概率矩阵和内容来评估该组字符,以标识经扩展的元数据标签。可以通过用于元数据标签评估的装置来检索与经扩展的元数据标签相关联的描述性内容。可以通过用于元数据标签评估的装置,基于描述性内容来生成元数据标签的描述。可以通过用于元数据标签评估的装置,来接收包括元数据标签的查询。可以通过用于元数据标签评估的装置,将经扩展的元数据标签标识为元数据标签的扩展。可以通过用于元数据标签评估的装置,提供元数据标签的描述作为查询的查询结果。

又一实施例涉及一种包括处理器可执行指令的计算机可读介质,这些处理器可执行指令被配置为实现本文中呈现的技术中的一个或多个。计算机可读介质或计算机可读设备的示例实施例在图5中示出,其中实现500包括其上编码有计算机可读数据506的计算机可读介质508,诸如CD-R、DVD-R、闪速存储器驱动器、盘硬盘驱动器等。该计算机可读数据506(诸如包括0或1中的至少一个的二进制数据)又包括一组计算机指令504,该组计算机指令504被配置为根据本文中阐述的一个或多个原理进行操作。在一些实施例中,例如,处理器可执行计算机指令504被配置为执行方法502,例如图1的示例性方法100中的至少一些。在一些实施例中,处理器可执行指令504被配置为实现一种系统,诸如图2的示例性系统200中的至少一些、图3的示例性系统300中的至少一些、和/或图4的示例性系统400中的一些至少。本领域普通技术人员可以设想到很多这样的计算机可读介质,它们被配置为根据本文中呈现的技术进行操作。

尽管已经用结构特征和/或方法动作特定的语言描述了主题,但是应当理解,所附权利要求中限定的主题不一定限于上述特定特征或动作。相反,上面描述的具体特征和动作被公开为实现至少一些权利要求的示例形式。

如本申请中使用的,术语“部件”、“模块”、“系统”、“接口”等通常旨在指代与计算机相关的实体,其为硬件、硬件和软件的组合、软件、或执行中的软件。例如,部件可以是但不限于在处理器上运行的过程、处理器、对象、可执行文件、执行线程、程序和/或计算机。作为说明,在控制器上运行的应用和控制器都可以是部件。一个或多个部件可以驻留在过程和/或执行线程内,并且部件可以位于一个计算机上和/或分布在两个或更多个计算机之间。

此外,所要求保护的主题可以被实现为使用标准编程和/或工程技术来产生软件、固件、硬件或其任何组合以控制计算机实现所公开的主题的方法、装置或制造品。本文中使用的术语“制造品”旨在涵盖从任何计算机可读设备、载体或介质可访问的计算机程序。当然,在不脱离所要求保护的主题的范围或精神的情况下,可以对该配置进行很多修改。

图6和以下讨论提供了用于实现本文中阐述的一个或多个规定的实施例的合适的计算环境的简要的一般描述。图6的操作环境仅是合适的操作环境的一个示例,并且无意对操作环境的使用范围或功能提出任何限制。示例计算设备包括但不限于个人计算机、服务器计算机、手持或膝上型设备、移动设备(诸如移动电话、个人数字助理(PDA)、媒体播放器等)、多处理器系统、消费电子产品、迷你计算机、大型计算机,包括任何上述系统或设备的分布式计算环境等。

虽然不是必需的,但是在由一个或多个计算设备执行的“计算机可读指令”的一般上下文中描述实施例。计算机可读指令可以经由计算机可读介质(如以下讨论的)来分发。计算机可读指令可以被实现为执行特定任务或实现特定抽象数据类型的程序模块,诸如功能、对象、应用编程接口(API)、数据结构等。典型地,计算机可读指令的功能可以在各种环境中根据需要组合或分配。

图6示出了包括被配置为实现本文中提供的一个或多个实施例的计算设备612的系统600的示例。在一个配置中,计算设备612包括至少一个处理单元616和存储器618。取决于计算设备的确切配置和类型,存储器618可以是易失性的(例如,诸如RAM)、非易失性的(诸如ROM、闪速存储器等)、或两者的某种组合。该配置在图6中用虚线614示出。

在其他实施例中,设备612可以包括附加的特征和/或功能。例如,设备612还可以包括附加的存储装置(例如,可移除的和/或不可移除的),包括但不限于磁存储装置、光存储装置等。这样的附加存储装置在图6中用存储装置620示出。在一个实施例中,用于实现本文中提供的一个或多个实施例的计算机可读指令可以在存储装置620中。存储装置620还可以存储实现操作系统、应用程序等的其他计算机可读指令。例如,计算机可读指令可以被加载在存储器618中用于由处理单元616执行。

本文中使用的术语“计算机可读介质”包括计算机存储介质。计算机存储介质包括以用于存储诸如计算机可读指令或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。存储器618和存储装置620是计算机存储介质的示例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪速存储器或其他存储技术、CD-ROM、数字多功能盘(DVD)或其他光存储装置、盒式磁带、磁带、磁盘存储装置或其他磁存储设备、或者是可以用于存储所需信息并且可以由设备612访问的任何其他介质。然而,计算机存储介质不包括传播信号。相反,计算机存储介质排除了传播信号。任何这样的计算机存储介质可以是设备612的部分。

设备612还可以包括允许设备612与其他设备通信的(多个)通信连接626。通信连接626可以包括但不限于调制解调器、网络接口卡(NIC)、集成网络接口、射频传输器/接收器、红外端口、USB连接、或用于将计算设备612连接到其他计算设备的其他接口。(多个)通信连接626可以包括有线连接或无线连接。(多个)通信连接626可以传输和/或接收通信介质。

术语“计算机可读介质”可以包括通信介质。通信介质通常以诸如载波或其他传输机制等“经调制的数据信号”来实施计算机可读指令或其他数据,并且包括任何信息传递介质。术语“经调制的数据信号”可以包括如下的信号,该信号的一个或多个特性以支持在信号中对信息进行编码的方式被设置或改变。

设备612可以包括(多个)输入设备624,诸如键盘、鼠标、笔、语音输入设备、触摸输入设备、红外相机、视频输入设备和/或任何其他输入设备。设备612也中可以包括(多个)输出设备622,诸如一个或多个显示器、扬声器、打印机和/或任何其他输出设备。(多个)输入设备624和(多个)输出设备622可以经由有线连接、无线连接或其任何组合连接到设备612。在一个实施例中,来自另一计算设备的输入设备或输出设备可以用作计算设备612的(多个)输入设备624或(多个)输出设备622。

计算设备612的部件可以通过诸如总线等各种互连来连接。这样的互连可以包括外围部件互连(PCI),诸如PCI Express、通用串行总线(USB)、火线(IEEE 1394)、光学总线结构等。在另一实施例中,计算设备612的部件可以通过网络互连。例如,存储器618可以由位于通过网络互连的不同物理位置的多个物理存储器单元组成。

本领域技术人员将认识到,用于存储计算机可读指令的存储设备可以跨网络分布。例如,经由网络628可访问的计算设备630可以存储用于实现本文中提供的一个或多个实施例的计算机可读指令。计算设备612可以访问计算设备630并且下载部分或全部计算机可读指令用于执行。可选地,计算设备612可以根据需要下载计算机可读指令的片段,或者一些指令可以在计算设备612处执行并且一些指令可以在计算设备630处执行。

本文中提供了实施例的各种操作。在一个实施例中,所描述的一个或多个操作可以构成存储在一个或多个计算机可读介质上的计算机可读指令,这些计算机可读指令如果由计算设备执行,将使得计算设备执行所描述的操作。描述部分或全部操作的顺序不应当被解释为暗示这些操作必须依赖于顺序。受益于本说明书的本领域技术人员将理解替代排序方式。此外,应当理解,并非所有操作都必须存在于本文中提供的每个实施例中。而且,应当理解,在一些实施例中,并非所有操作都是必需的。

此外,除非另外规定,否则“第一”、“第二”等无意暗示时间方面、空间方面、排序等。相反,这些术语仅被用作特征、元素、属于等的标识符、名称等。例如,第一对象和第二对象通常对应于对象A和对象B、或两个不同的对象、或两个相同的对象、或同一对象。

此外,本文中使用“示例性”来表示用作示例、实例、说明等,而不一定是有利的。如本文中使用的,“或”旨在表示包含性的“或”而不是排他性的“或”。另外,除非另有说明或者从上下文清楚地指向单数形式,否则本申请中使用的“一”和“一个”通常被解释为表示“一个或多个”。而且,A和B等中的至少一个通常表示A或B,和/或A和B。此外,就“包括的”、“具有的”、“具有”、“有”和/或其各种变体用于具体实施方式或权利要求书中而言,这些术语旨在以类似于术语“包括”的方式是包含性的。

此外,尽管已经关于一个或多个实现示出和描述了本公开,但是基于对本说明书和附图的阅读和理解,本领域技术人员将会想到等同的改变和修改。本公开包括所有这样的修改和改变,并且仅由所附权利要求的范围来限制。特别是关于由上述部件(例如,元件、资源等)执行的各种功能,除非另有说明,否则用于描述这样的部件的术语旨在对应于执行所描述的部件的规定功能的任何部件(例如,功能上等同的),尽管这些部件在结构上不等同于所公开的结构。另外,尽管可能已经相对于若干实现中的仅一个实现来公开本公开的特定特征,但是只要对于任何给定或特定应用而言可以是期望的和有利的,这样的特征就可以与其他实现的一个或多个其他特征组合。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号