首页> 中国专利> 使用社交行为分析和词汇分类的推荐系统

使用社交行为分析和词汇分类的推荐系统

摘要

提供了用于向基于计算机的网络中的用户提供对用户潜在感兴趣的项的推荐的方法和系统。用户潜在感兴趣的项和人可以利用所获得的基于词语的社交行为信息、语义敏感的词汇分类以及所确定的隐含的特定于话题的社交网络来确定。可向用户呈现包括推荐、与推荐有关的依据说明以及使用户提供与推荐或依据有关的反馈的机会的图形用户界面。反馈可用来改进将来的推荐。

著录项

  • 公开/公告号CN101903874A

    专利类型发明专利

  • 公开/公告日2010-12-01

    原文格式PDF

  • 申请/专利权人 雅虎公司;

    申请/专利号CN200880121847.8

  • 申请日2008-12-10

  • 分类号G06F17/00;G06Q50/00;G06F17/30;

  • 代理机构北京东方亿思知识产权代理有限责任公司;

  • 代理人宋鹤

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-18 01:18:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-05-20

    授权

    授权

  • 2015-03-18

    专利申请权的转移 IPC(主分类):G06F17/00 变更前: 变更后: 登记生效日:20150217 申请日:20081210

    专利申请权、专利权的转移

  • 2011-01-12

    实质审查的生效 IPC(主分类):G06F17/00 申请日:20081210

    实质审查的生效

  • 2010-12-01

    公开

    公开

说明书

技术领域

本公开一般涉及基于计算机的推荐系统。

背景技术

社交行为和社交网络在因特网和其它网络上越来越普遍、复杂和重要。此外,向特定用户推荐感兴趣的或潜在感兴趣的项或人的推荐系统和方法正在发展并且越来越有用和有益。更好的推荐系统可以因积极的社交行为而回报用户,这促进了更大程度地参与具有社交方面的站点或应用。

附图说明

图1图示出了根据本发明一个实施例的示例网络环境100;

图2图示出了可用来实现物理服务器的示例计算系统体系结构;

图2A是根据本发明实施例的方法的流程图;

图3是根据本发明实施例的方法的流程图;

图4是根据本发明实施例的方法的流程图;

图5是示出根据本发明实施例的词汇分类(vocabulary taxonomy)的使用的简化概念框图;以及

图6是根据本发明实施例的方法的流程图。

具体实施方式

这里,各个术语“词汇”和“词汇分类”广泛地包括词语(word)、词语组、术语组(groups of terms)、短语组或其它言词构造的任意组合,并且可以包括各种形式的与这些词语、术语或短语有关的各种其它信息。这样的其它信息可以包括与语义、同义或反义、层次、包含、关系、相互依赖性、分析等有关的信息。这样的信息可以包括含义信息、层次信息等。词汇分类可以包括尽可能小的词语或术语组,或者可以包括其它信息。

这里,术语“隐含的社交网络”可以广泛地包括被确定为基于一个或多个特性、行为或性质或其它信息以某种方式相关联或可相关联的一组用户或其它个体,即使这些用户可能或可能不明确地彼此相关联,例如一起在经宣告的组中。此外,隐含的社交网络可以包括或者被添加到一个或多个明示的社交网络,或者与一个或多个明示的社交网络相集成或组合。另外,“隐含的特定于话题的社交网络”包括与一个或多个特定话题、主题、区域等相关联的隐含社交网络。

这里,潜在感兴趣的项或人可以广泛地包括内容、事物、产品、服务或各种其它可标识或可指出的事物、实体、概念等。例如,项可以包括用户可能希望查看、观看、阅读、体验、交互、调查、购买等的项。人可以包括用户、联系人、姓名、其它标识等,包括因友谊或其它关联性或者甚至因约会等而被推荐以供用户进行联络、调查或交互的人。如这里使用的社交行为广泛地包括由人或用户进行的各种形式的行为。用户进行的社交行为可以包括以某种方式与其它用户或关于其它用户的任何事物联系或可与其联系的举止或活动。

包括基于计算机的社交行为在内的社交行为可以采取多种形式。用户可以在各种环境中通过各种应用来建立明示的朋友网络。此外,任何形式的用户到用户联系或通信(无论是明示的还是隐含的)都是一种形式的社交行为。社交行为也可以连同内容来展示。内容相关的社交行为可以包括这样的活动,例如,加书签(bookmarking)、贴标签(tagging)、内容共享、博客,或者其它明示或隐含的对兴趣或偏好的指示。社交行为还可以包括无线环境中的行为,例如与诸如蜂窝电话、PDA之类的无线的、手持式或便携式设备或者其它设备或接口的输入或交互。

在一些实施例中,可以基于诸如加标签之类的用户的社交行为或者对其的比较来确定、推导或推断社交网络。例如,可以确定不同用户的社交行为中的共性、联系或模式,例如共同感兴趣的话题。这些共性、联系或模式随后可用来辅助确定要推荐给用户的项或人。例如,被推荐项可以包括受隐含社交网络(或者包括明示的和隐含的网络信息的组合网络)中的用户欢迎的项、表现出与另一用户类似的贴标签模式的特定用户感兴趣的项。

在一些实施例中,被确定为共享感兴趣话题的用户群组可以与特定于话题的词汇分类相关联,或者可以结合这样的群组来开发这样的词汇分类,或者这两种情况。

在一些实施例中,特定的词汇和词汇分类可被生成并使用。这样的词汇分类可用来推断或辅助推断或确定隐含的社交网络,或者反之亦然,或者这两种情况。词汇分类可以是语义敏感的。语义敏感的词汇分类可以包括这样的词汇分类,其不仅捕获词语而且捕获与含义、术语的层次、同义词等有关的信息,以更准确且充分地表示词汇。

包括了如下的本发明的实施例,这些实施例涉及用于计算机用户的推荐系统和方法以及用于这样的推荐系统和方法的、与这样的推荐系统和方法一起使用的或者在这样的推荐系统和方法中使用的技术。这样的确定和表示可以至少部分地基于基于计算机的用户社交行为(例如贴标签、加书签等)来作出。在一些实施例中,对社交行为的分析可以包括数学的、算法的或统计分析以确定用户、用户群组、话题、内容或其组合之间的联系或联系强度。这样的分析随后可用来确定特定用户潜在感兴趣的项或人。

如这里使用的“标签空间”可以包括各种形式的数学、算法或统计分析或确定,以及用于数学、算法或统计分析或确定的结构。例如,标签空间可以包括或引起多维空间,其中,空间中的诸如轴之类的方面表示特定实体或因素的量化或者允许对特定实体或因素的量化。此外,标签空间可以包括、辅助或结合与贴标签或其它形式的社交行为有关的因素,以及与词汇、词汇术语、词汇分类和用户或用户群组等的词汇使用有关的因素。标签空间中的点之间的向量或距离可用来确定或估计用户、用户行为、贴标签、词汇、词汇或词汇分类的术语以及感兴趣的或使用的其它确定之间的类似性。

在一些实施例中,确定为潜在感兴趣的项或人可被推荐给用户。推荐可以伴随有对确定的说明或者推荐的依据(rationale),例如可包括词汇词语、术语或层次的可视说明或注解。推荐和说明可以促进积极的社交行为并且影响诸如贴标签之类的用户行为,这随后可以改进将来的隐含网络确定和推荐等。此外,用户可以被提供有提供反馈的机会,反馈可用来评估推荐或说明的质量或验证推荐或说明,该反馈随后可用来改进将来的推荐的质量。在一些实施例中,通过循环,促使用户更积极地参与社交站点,并且能够更好地享受Web或更具体网络上的更宽范围的内容以及更相关的可获得内容。积极的社交行为被回报以质量改善的推荐。

例如,在一些实施例中,用户可以通过图形用户界面提供反馈来验证所推荐内容。该界面使得用户能够例如提供肯定的或否定的反馈,或者通过贴标签和投票来验证推荐。该反馈随后可用来细化或改进将来的推荐确定以及推荐。

在一些实施例中,一组用户间的社交行为可用来确定要推荐给特定用户的项或人。社交行为可用来确定隐含的社交网络,隐含的社交网络随后可用来确定潜在感兴趣或可能感兴趣的项或人以推荐给特定用户(或者反之亦然,或者这两种情况)。隐含的社交网络可由它们自己使用,或者另外地与明示的社交网络相组合。词汇或词汇分类可用来确定隐含的社交网络。词汇分类或者其各方面可将语义考虑在内或者以其他方式受语义的影响。隐含的社交网络可以是特定于话题的。

在一些实施例中,词汇分类可用来确定隐含的特定于话题的社交网络(或反之亦然,或者这两种情况)。隐含的特定于话题的社交网络可用来确定潜在感兴趣的项或人以推荐给特定用户。

包括对项的推荐的、诸如图形用户界面之类的表示可被生成或提供给用户。词汇分类可以是语义敏感的。表示可以包括与在向用户推荐项的确定中使用的依据有关的注解或其它指示:这样的注解可以包括对相关词汇分类的参考或者来自相关词汇分类的词语。

用户可被提供有提供与推荐或其依据有关的反馈的接口和机会。反馈可用来增强或改进将来的推荐确定和推荐。在一些实施例中,词汇或词汇分类不是静态地一次生成的,而是可以基于包括另外地贴标签行为、用户反馈、隐含的社交网络信息和其它所收集信息在内的因素而被修改或添加。

在一些实施例中,可以利用诸如多维标签空间之类的标签空间来表示或分析用来作出确定或推荐的方面、因素或实体。标签空间中的向量可以指示实体的接近性或类似性,例如隐含社交网络中的用户之间的类似性。这样的分析随后可用来例如通过向用户推荐第二用户感兴趣的项来作出推荐确定,如标签空间中所表示的,该第二用户是最接近的。

如所提到的,在一些实施例中,社交行为用来确定隐含社交网络,隐含社交网络可以包括特定于话题的隐含社交网络。例如,在一些实施例中,给定诸如软件、烹饪、旅游业、新闻等之类的任何感兴趣话题,则可以利用对用户社交行为的统计分析或算法分析(例如可能与话题相关的或相关联的所贡献的或共享的内容)来确定特定于话题的隐含社交网络。就话题表现出共性、模式或相关联行为的用户或用户简档可被确定为在特定的隐含社交网络中。

此外,语义敏感的词汇分类可被用在这样的分析中。作为简单示例,词汇分类可以包括在更大的概念或话题“烹饪”内的“烘焙”和“烧烤”。利用该信息,能够确定,表示对“烘焙”感兴趣的用户以及表示对“烧烤”感兴趣的其它用户在特定的隐含的特定于话题的社交网络中。

另外,词汇分类的言词层次可用来说明推荐依据。例如,如果对烘焙感兴趣的用户也对烹饪书籍、站点等感兴趣,则烹饪书籍、站点等可被推荐给对烧烤感兴趣的用户。利用该推荐或者与该推荐相关联地,可以提供说明,该说明包括也对烹饪感兴趣的用户(或多个用户)表达出对烹饪书籍、站点等感兴趣的事实。

在一些实施例中,构建诸如隐含社交网络之类的新的网络以及作出推荐确定包括:评估参与网络或对网络有含义的实体或因素(例如用户、子网络、兴趣、话题等)的类似性。在一些实施例中,每个这样的实体的含义在标签或其它社交行为的空间中给出,以使得对这些标签的向量的比较允许评估由这些向量表示的对象的类似性。这进而可以用来作出推荐确定和推荐。

可使用的一类统计方法的一个示例包括利用标签空间或其它社交行为空间的方法,如上面简要提到的。例如,给定话题T,可以通过考虑与平均用户相比被标记为与T相关的用户u1和u2的网页、照片或其它内容,来计算u1和u2之间的距离。内容可通过若干方式来标记:通过贴标签、提供赞许反馈,或者在诸如博客张贴之类的用户贡献的内容的情况中,通过考虑张贴文本中的词语。距离是定向的,并且其被归一化到[0,1]范围中。距离函数考虑对被标记为与两个用户相关的内容的同意(重叠)和不同意,并且还考虑针对话题T的内容的文集或群组宽重要性(group-wideimportance)(与逆文档频率(IDF)类似的概念)。所确定的隐含社交网络中的用户u1和u2之间的联系强度(以及他们是否在特定的隐含社交网络中)可以通过这两个用户之间的距离的函数来表达或被确定为这两个用户之间的距离的函数。

如上面所提到的,一些实施例使用所确定的或所生成的词汇或词汇分类。例如,在一些实施例中,给定社交网络(隐含的、明示的或者其组合),可以推导出或生成表示特定于社交网络的含义的词汇,该含义是该网络的用户共有的。例如,词语“Java”在一个网络中可以指编程语言,而在另一网络中指咖啡品牌。作为另一示例,词语“Casablanca”在给影片相关网站贴标签的Del.icio.us用户的网络中可以是指影片标题,而在对旅行照片感兴趣的用户的网络(例如Yahoo!照片共享站点Flickr)中是指城市。作为又一示例,词语“菜单”在软件网络(特定于话题的社交网络)中可以指图形用户界面的元件,而在餐馆-行人网络中是指食物选择。所推导出的或生成的词汇或词汇分类可以捕获各种语言学的或词义特征,包括如同义之类的主导句法特征,以及被指派给特定社交群组的术语或与特定社交群组的术语相关联的含义。

如上面所提到的,在一些实施例中,推荐可以伴随有(或与其相关联)向用户提供的针对用于确定所推荐项或人的依据的可视说明、注解或指示,依据例如是项可能是用户潜在感兴趣的或者与用户相关的这样的确定背后的推理。例如可基于用户之间的标签的共同出现而生成的层次词汇分类可以被使用。这样的词汇分类除了别的之外可以基于(并且反之亦然,可能有助于允许)标签的特异性和层次的确定来组建。

在一些实施例中,可以利用来自外部源的词汇、词语或者词汇或词语分类来丰富或扩大所生成的词汇分类。例如,与Wikipedia.org网站相关联的WordNet词典或同义词词典(thesaurus)可以用来确定、关联或联系同义词、下位词等。作为另一示例,可以从来自诸如LinkedIn之类的网站的计算机专业人员的履历中提取共同计算术语。作为又一示例,网站Facebook上专用于给定大学的词汇可以包括学校的吉祥物、团队、体育起步、受欢迎学科以及教授等,如从站点获得的。

在一些实施例中,各种形式的统计的、数学的或算法技术可用来生成词汇分类。例如,在一些实施例中,可对文本内容(存在于社交网络中的任何文本,例如博客张贴、标签)使用统计分析以推导出表征个体用户或社交网络的词汇。词汇可以是或包括经加权的术语的层次结构,并且较高层级的术语可以称为话题。权重可以表示标签空间中的例如话题、子话题和术语之间的距离。

作为一个具体示例,词汇或词汇分类可被表示为术语的集合,例如[java web computing art]。对于大小为N的词汇,上下文元素C于是可在标签空间中通过N元词汇向量VC来描述,其中,VC[i]∈[0,1]表示C与第i个词汇术语之间的近似性。因此,例如,针对词汇[java web computing art]的词汇向量[0 0.5 0.33 1]表示对于“java”不存在近似性,对于“art”存在最大的近似性并且对于“web”和“computing”存在中等近似性。余弦向量距离随后可用来比较该空间中的元素。

如上面所提到的,本发明的实施例可以结合包括与社交网站相关联的行为在内的社交行为来使用。例如,本发明的实施例可以结合社交内容站点来使用,社交内容站点包括用户用来贡献、消费和评价内容的站点。在这些站点上,用户可以明示地(例如通过宣布友谊关系)并且隐含地(例如通过内容消费、创建、创作、修改或评价或者通过导航、贴标签、加书签等表明的)表现出社交行为。共享的、共同的或相关联的行为可用来标识新的或隐含的用户网络并且确定并推荐潜在感兴趣的项、内容或人。潜在感兴趣的人可以包括因友谊、关系、联络、约会等而推荐的人。

本发明的实施例可以使用或应用的社交站点的示例是Del.icio.us。在该站点上,用户形成友谊网络,并且利用可以包括各个词语或短语的标签来给网页加书签并注解。本发明的实施例可用来通过基于用户贴标签行为等来建议或确定新的社交站点或与其它用户的联系来增加或扩大用户的明示友谊网络。经扩大的网络可用于确定并推荐用户潜在感兴趣的、但现在不为用户所知的新的内容,例如经加书签的URL。

在一些实施例中,可从其确定隐含社交网络的社交行为包括如下线索,例如博客张贴上的评论、诸如Yahoo!Answers之类的站点上的回复、关于类似或有关话题的张贴等。这样的社交行为还可以包括共同的加书签或贴标签行为或模式,例如用户在诸如Del.icio.us之类的站点上将相同的一个或多个URL添加到其收藏夹(favorite),或者利用类似或有关的词语给同一URL加书签。

如上面所提到的,一些实施例利用词汇分类。这样的词汇分类可以辅助组织、利用并汇聚词汇或社交内容站点。尽管用户有时可能使用奇怪的或罕见的标签,然而词汇分类可以辅助将这些标签归入语义上下文中,例如通过将它们与较高层级术语相关联,并且通过参考来自词汇分类的相关联术语来对推荐进行说明。这进而可以增加用户对与用户潜在相关的或者用户感兴趣的所推荐项或人的鉴定和理解,并且使得推荐依据和处理对用户来说更透明并且更清楚。

如上面所提到的,隐含社交网络可用于确定要推荐给用户的项或人。例如,用户的社交网络可用来将新的内容推荐给该用户。例如,在Del.icio.us网站中,在用户的社交网络中最经常被加书签并且/或者被贴标签的URL可以被推荐。在一些情况中,例如当响应于来自用户的明示搜索请求而推荐内容时,除了在用户的社交网络中的受欢迎度以外,还可以考虑资源与查询之间的内容类似性。除了受欢迎度和内容类似性以外,还可以基于新近度(recency)来使推荐优先级化。例如,博客张贴的日期或者用户与Del.icio.us中的URL相关联的第一次贴标签日期可被包括以使推荐优先级化。

在一些实施例中,向用户的推荐可以经由例如包括在网页中的图形用户界面来提供,并且可以伴随有对推荐背后的依据的说明。例如,推荐可以被注释有用来推导出或确定该推荐的词汇。这样的注释可以向用户提供另外的元数据或上下文,以辅助用户理解推荐的出处或推理。此外,用户可以通过在将来对其它内容贴标签来丰富该词汇。

图1图示出了特定实现方式可以在其中进行操作的示例网络环境。本发明的特定实现方式在诸如因特网之类的广域网环境中操作。如图1所示,本发明的特定实现方式可以在包括社交网络站点20的网络环境中操作,社交网络站点20可操作地耦合到网络云60。网络云60通常表示这里描述的系统和主机可通过其进行通信的一个或多个互连网络。网络云60可以包括基于分组的广域网(例如因特网)、私有网络、无线网络、卫星网络、蜂窝网络、寻呼网络等。客户端或用户节点82和84经由网络服务提供商或任何其它合适的手段被可操作地连接到网络环境。客户端节点82和84可以包括个人计算机或蜂窝电话,以及诸如膝上型计算机、个人数字助理(PDA)等之类的其它类型的移动设备。

社交网络站点20是网络可寻址系统,其容宿了一个或多个用户可通过计算机网络访问的社交网络应用。社交网络应用可以包括用户可以在其中通过计算机网络请求并接收经标识网页和其它内容的网站和服务器功能。社交网络应用还可以允许用户配置并维护持个人网页。

在特定实现方式中,社交网络站点20包括一个或多个物理服务器22以及一个或多个数据存储装置24。一个或多个物理服务器22经由路由器26可操作地连接到计算机网络60。一个或多个物理服务器22容宿允许用户与社交网络交互的功能,例如从客户端节点82和84上载并检索内容。在一种实现方式中,由一个或多个物理服务器容宿的功能可以包括web或HTTP服务器、FTP服务器等。

物理服务器22还容宿涉及这里描述的社交网络站点20的功能。在一种实现方式中,数据存储装置24可以存储用户帐户信息,包括诸如用户标识符、密码、姓名等之类的核心信息以及其它用户有关信息,例如用户简档数据、地址、偏好、财务账目信息、对所更新内容的指示符以及对用于处理内容的一个或多个模块的指示符等。给定的数据存储装置24还可以存储诸如数字内容数据对象和其它媒体资产之类的内容。在特定实现方式中,内容数据对象或内容对象是通常被存储或嵌入在数据文件或记录中的各个数字信息项。内容对象可以采取多种形式,包括:文本(例如,ASCII、SGML、HTML)、图像(例如jpeg、tif和gif)、图形(基于向量的或者位图)、音频、视频(例如mpeg)或者其它多媒体,以及它们的组合。内容对象数据还可以包括可执行代码对象(例如,可在浏览器窗口或框中执行的游戏)、播客等。在结构上,内容数据存储装置24意味着一大类的数据存储和管理系统。在特定实现方式中,内容数据存储装置24可以通过任何适合的物理系统来实现,该物理系统包括诸如数据库服务器、海量存储介质、媒体库系统等之类的组件。

这里描述的服务器主机系统可以在较宽阵列的计算系统和体系结构中实现。下面为了教导目的而非限制性目的来描述示例计算体系结构。

服务器计算机102也连接到网络。服务器计算机102包括CPU 112和数据存储设备114。数据存储设备包括数据库116和推荐程序118。推荐程序118旨在广泛地表示用来执行根据本发明实施例的方法和技术的所有程序、算法、软件、模块等。在各个实施例中,推荐程序118可以存储在单个服务器或多个服务器或其它计算机或设备上。

图2图示出了可用来实现物理服务器的示例计算系统体系结构。在一个实施例中,硬件系统200包括处理器202、缓存存储器204,以及涉及这里描述的功能的一个或多个软件应用和驱动器。另外,硬件系统200包括高性能输入/输出(I/O)总线206和标准I/O总线208。主机桥接器210将处理器202耦合到高性能I/O总线206,而I/O总线桥接器212将两个总线206和208彼此相耦合。系统存储器214和网络/通信接口216耦合到总线206。硬件系统200还可以包括视频存储器(未示出)以及耦合到该视频存储器的显示设备。海量存储装置218和I/O端口220耦合到总线208。硬件系统200可选地可以包括耦合到总线208的键盘和点选设备以及显示设备(未示出)。总而言之,这些元件旨在表示广泛类别的计算机硬件系统,包括但不限于基于如下处理器的通用计算机系统:由California的Santa Clara的因特尔公司制造的兼容x86的处理器,以及由AdvancedMicro Devices(AMD)公司制造的兼容x86的处理器的,以及任何其它合适的处理器。

下面将更详细描述硬件系统200的元件。具体地,网络接口216提供硬件系统200与诸如以太网(例如,IEEE 802.3)网络等之类的广泛范围网络中的任意网络之间的通信。海量存储装置218提供对用于执行上述在本地服务器22中实现的功能的数据和编程指令的永久性存储,而系统存储器214(例如,DRAM)提供对处理器202执行的数据和编程指令的临时性存储。I/O端口220是一个或多个串行的和/或并行的通信端口,这些通信端口提供了可以耦合到硬件系统200的其它外围设备之间的通信。

硬件系统200可以包括多种系统体系结构;并且硬件系统200的各种组件可被重新布置。例如,缓存204可与处理器202位于芯片上。或者,缓存204和处理器202可被封装在一起作为“处理器模块”,其中处理器202被称为“处理器核心”。此外,本发明的某些实施例可能不需要或包括所有的上面的组件。例如,被示为耦合到标准I/O总线208的外围设备可以耦合到高性能I/O总线206。另外,在一些实施例中,可能仅存在单条总线,而硬件系统200的组件被耦合到该单条总线。此外,硬件系统200可以包括其它组件,例如其它处理器、存储设备或存储器。

如下面所讨论的,在一种实现方式中,这里描述的一个或多个物理服务器的操作可被实现为由硬件系统200运行的软件例程系列。这些软件例程包括将由诸如处理器202之类的硬件系统中的处理器执行的多个指令或指令系列。最初,指令系列可被存储在诸如海量存储装置218之类的存储设备上。然而,指令系列可被存储在任何合适的存储介质上,例如磁盘、CD-ROM、ROM、EEPROM等。此外,指令系列不一定存储在本地,而是可以经由网络/通信接口216从诸如网络上的服务器之类的远程存储设备接收。指令从诸如海量存储装置218之类的存储设备被拷贝到存储器214,并且随后被处理器202访问并执行。

操作系统管理并控制硬件系统200的操作,包括向软件应用(未示出)输入数据以及从软件应用(未示出)输出数据。该操作系统提供了在系统上被执行的软件应用与系统的硬件组件之间的接口。根据本发明的一个实施例,操作系统是可从Wash.Redmond的微软公司获得的Windows95/98/NT/XP/Vista操作系统。然而,本发明可以与其它合适的操作系统一起使用,例如可从加州Cupertino的苹果计算机公司获得的AppleMacintosh操作系统、UNIX操作系统、LINUX操作系统等。当然,其它实现方式也是可以的。例如,这里描述的服务器功能可由通过背板通信的多个服务器片(server blade)来实现。

图2A是根据本发明实施例的方法250的流程图。步骤252包括获取与多个用户的基于词语的社交行为有关的信息。步骤254包括利用推荐程序分析所获得的信息。步骤256包括至少部分地基于该分析,确定用户潜在感兴趣的项或人,以推荐给特定用户。步骤258包括经由图形用户界面呈现对项或人的推荐。

图3是根据本发明实施例的方法300的流程图。步骤302包括获取与多个用户的基于词语的社交行为有关的信息。步骤304包括利用词汇分类来分析所获得的信息以确定隐含的特定于话题的社交网络。步骤306包括至少部分地基于与一个或多个隐含的特定于话题的社交网络有关的信息,确定潜在感兴趣的项或人以推荐给用户。步骤308包括辅助向用户呈现包括被确定为潜在感兴趣的项的推荐的图形用户界面。

图4是根据本发明实施例的方法400的流程图。步骤402包括利用推荐程序确定潜在感兴趣的项或人以推荐给用户。步骤404包括辅助向用户呈现包括潜在感兴趣的项或人的图形用户界面。步骤406包括辅助呈现对在确定用户可能感兴趣的项或人时使用的依据的指示。步骤408包括辅助向用户呈现用户提供与推荐或依据有关的反馈的机会。

图5是示出根据本发明实施例的词汇分类的简化概念框图500。如上面所提到的,在一些实施例中,词汇分类可以结合确定隐含的特定于话题的社交网络来生成并使用。特定于话题的社交网络随后可用于确定要推荐给用户的项或人。如图5所示,四个用户502、504、506、508从其社交行为,例如贴标签中被确定为示出了特别地对汽车这个话题感兴趣的指示。因此,用户502、504、506、508可被包括在与汽车话题510有关的隐含社交网络中。框512提供了对词汇分类的一部分的简化表示,该词汇分类可与确定用户502、504、506、508的共享兴趣及其对关于汽车510的隐含社交网络的归属相联系地来使用。

如图所示,词汇分类是语义敏感的,以使得能够确定:其贴标签行为包括使用标签“convertibles”的第三用户506,作为使用该标签的结果,不被考虑为与汽车有关的隐含社交网络的一部分。尽管词汇分类包括词语“convertibles”,然而在该分类中使用的该词语原意是敞篷汽车(convertible car)。可确定,第三用户506与折合式沙发(convertiblesofa)而非汽车相联系地使用该标签。因此,第三用户不被考虑为与汽车510有关的隐含社交网络的一部分。

如所提到的,图5仅提供了使用语义敏感的词汇分类和隐含的特定于话题的社交网络的一个极简化的示例。应当记住,在各个实施例中,词汇分类可在确定隐含社交网络之前、期间和/或之后生成,并且在各个实施例中,词汇分类和隐含社交网络中的每个可用来辅助构建或确定另一个。

如图5所示,语义敏感的词汇分类与在语义上对诸如贴标签之类的社交行为的准确分析一起可用来准确地确定隐含社交网络。这样的网络随后可用来确定适当的项或人以推荐给用户,例如在该隐含社交网络中的用户。例如,在一些实施例中,在社交网络的用户中最受欢迎的项可用来被推荐给网络中尚未表示出对该项感兴趣的特定用户。

图6是根据本发明实施例的方法600的流程图。步骤602包括获取与用户组中的一个用户的社交行为类型组中的一个类型有关的信息。步骤604包括将该信息存储在数据库中。在步骤606,方法600查询该组中是否存在更多的类型。如果存在,则方法返回步骤602,将步骤602应用于不同类型的社交行为。如果不存在,则方法600继续到步骤608。

在步骤608,方法600查询在该组中是否存在更多用户。如果存在,则方法600返回步骤602,将步骤602应用于不同用户。如果不存在,则方法600继续到步骤610。

步骤610包括:分析该信息,包括使用词汇分类。步骤612包括确定用户潜在感兴趣的项或人。步骤614包括:向用户呈现对所确定的潜在感兴趣项或人的推荐和依据。步骤614还包括:向用户呈现提供与推荐或依据或它们两者有关的反馈的机会。

在步骤616,方法600查询是否提供了反馈。如果否,则方法在步骤618处结束。如果是,则在步骤620,反馈被用来改进或辅助改进将来的推荐或者结合推荐作出的分析或确定。例如,在一些实施例中,如图6所示,一旦在步骤620接收到反馈,方法600就返回以在步骤610中进行分析,并且反馈随后例如被用于影响、改进或辅助改进将来推荐的质量。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号