首页> 中国专利> 互联网实时信息推荐预测系统

互联网实时信息推荐预测系统

摘要

一种互联网技术领域的实时信息推荐预测系统,包括:数据处理服务器以及实时应用服务器,其中:数据处理服务器训练来自各用户及浏览用户的数据信息,实时应用服务器浏览用户在实时浏览网站时的互联网信息特征数据或向用户输出相关分析结果;实时应用服务器包括:互联网用户识别单元、实时信息发布处理单元以及信息发布预测推荐结果输出单元;数据处理服务器包括:输入单元、存储单元、中央处理单元和输出单元。本发明能够实现分析并获取其他用户在投放互联网信息中的信息,利用获取的这些信息可以指导用户在实时信息发布过程中的采取相应策略,这些策略包括但不限于指导用户进行指导为用户进行互联网信息发布,指导用户提供各类报告分析等。

著录项

  • 公开/公告号CN103177129A

    专利类型发明专利

  • 公开/公告日2013-06-26

    原文格式PDF

  • 申请/专利权人 上海新数网络科技有限公司;

    申请/专利号CN201310139138.5

  • 发明设计人 赵士路;许栊;王煜炜;刘宏建;

    申请日2013-04-19

  • 分类号G06F17/30(20060101);

  • 代理机构31201 上海交达专利事务所;

  • 代理人王毓理;王锡麟

  • 地址 201800 上海市嘉定区南翔镇嘉好路1690号2幢423室

  • 入库时间 2024-02-19 19:20:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-03-16

    授权

    授权

  • 2016-02-17

    著录事项变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20130419

    著录事项变更

  • 2013-07-24

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20130419

    实质审查的生效

  • 2013-06-26

    公开

    公开

说明书

技术领域

本发明涉及的是一种互联网技术领域的系统,具体是一种互联网实时信息推荐预测系统。

背景技术

随着网络的高速发展,网络作为最大的信息载体和交流平台,已成为当前进行信息宣传 的重要途径。常规的信息(如新闻、广告、商品等)是制定媒介策略,透过媒体定位覆盖目标 受众,为实现精准,也不过在投放后再以数据去验证、调整,很难实现考虑受众是否感兴趣和 接受。而对于互联网实时信息推送(如个性新闻发布,实时广告竞价,个性商品展示等),在 投放前就已寻找到合适的受众,真正实现互联网化广告的精准投放、个性营销。

一般来讲,信息发布客户会通过拟发布信息的属性分析来与其他信息发布客户进行对比 最终取得来自媒体的信息发布空间。例如,对于实时竞价广告系统来讲,需求方平台根据点通 率、关键字、金额、广告和宣传活动,等指标来与其他用户进行竞价来最终获得来自媒体的广 告空间。

但在这个信息发布过程中信息发布客户所能获得信息,只能通过自身为用户投放互联网 信息的历史信息进行预测。不能有效的利自其他信息发布客户的信息,导致信息的盲目发布。

目前国内外对互联网信息推荐综合性分析的研究还不多,在现有信息推荐中,存在利用 互联网信息进行推荐及预测的技术,如中国专利文献号CN101923545B,授权日2012-10-10,公 开了一种个性化信息推荐的方法,适无线互联网,手机上的行为记录模块记录,对用户访问的 页面的内容进行分析,得到用户感兴趣的页面集及用户对页面的兴趣度;将所述感兴趣的页面 集与页面的兴趣度进行结合,建立用户兴趣模型,产生推荐的个性化信息。该技术能够自动记 录分析用户行为,挖掘用户属性及偏好,实现了用户属性和信息内容的匹配,并主动推荐给用 户。但该技术与本发明相比的不足之处在于:该技术虽然可以对用户的行为进行分析,但仅是 针对用户自身的行为记录进行分析,并不能对与其存在关联关系的其他用户进行同时分析,并 进而反向对该用户做出推荐与预测。

在现有信息推荐中,还存在利用互联网用户关系进行推荐及预测的技术,如中国专利文 献号CN101540739B,授权日2011.10.05,公开了一种用户推荐方法,根据好友关系网络预测候 选好友;将候选好友返回用户端。上述用户推荐方法依据用户之间的好友关系进行预测,不依 赖于用户的个人信息,并且能够通过好友关系扩展交际面。但该技术与本发明相比的不足之处 在于:该技术虽然可以利用好友关系对用户的行为进行分析,但仅是指已存在的好友关系网络, 并不能利用互联信息发布过程中大量存在的未知用户关系,并对该用户做出推荐与预测。

综上所述,需要有一种方法可以综合考虑互联网浏览用户行为,用户行为来实现综合实 时互联网信息的推荐预测从而指导信息发布用户进行有效的信息发布。

发明内容

本发明针对现有技术存在的上述不足,提出一种互联网实时信息推荐预测系统,能够实 现分析并获取其他用户在投放互联网信息中的信息,利用获取的这些信息可以指导用户在实时 信息发布过程中的采取相应策略,这些策略包括但不限于指导用户进行指导为用户进行互联网 信息发布,指导用户提供各类报告分析等。

本发明是通过以下技术方案实现的,本发明包括:数据处理服务器以及实时应用服务器, 其中:数据处理服务器训练来自各用户及浏览用户的数据信息,实时应用服务器浏览用户在实 时浏览网站时的互联网信息特征数据或向用户输出相关分析结果。

所述的实时应用服务器包括:互联网用户识别单元、实时信息发布处理单元以及信息发 布预测推荐结果输出单元,其中:互联网用户识别单元定向以往登录的用户,实时信息发布处 理单元根据互联网用户识别单元识别出的用户从数据处理服务器的训练结果中提取相应的预 测推荐结果并进行相应的处理。预测推荐结果输出单元则将最终的预测推荐结果进行输出。

所述的数据处理服务器包括:输入单元、存储单元、中央处理单元和输出单元,其中: 输入单元的输出端与中央处理单元连接并传输采集到的网络用户行为信息,中央处理单元根据 网络用户行为信息生成决策树和训练集,并通过输出单元以声光方式输出用户行为分析预测结 果、通过存储单元保存用户对应的决策树和训练集。

所述的网络用户行为信息包括:自网站的互联网发布信息数据、互联网信息内容数据、 互联网信息特征历史数据、用户信息、浏览用户信息数据。

所述的输入单元采用通过爬虫不断读取网络日志、从其他数据库直接输入、从键盘进行 文字输入、通过麦克风进行声音输入或者通过扫描仪进行图像输入。

所述的中央处理单元包括:实时信息分析单元和预测分析单元,其中:实时信息分析单 元从输入单元收到网络用户行为信息并通过解析得到信息发布特征属性、互联网发布信息、互 联网信息内容数据,分别根据其中的信息发布特征属性生成对应的决策树并分别输出至存储单 元和预测分析单元,根据其中的互联网信息内容数据进行用户行为分析并生成预测训练集;预 测分析单元根据决策树和预测训练集对进行决策树训练以及用户行为预测。

所述的信息发布特征属性包括:受众类别、信息类别、信息长度、信息情绪、信息发布 位置、发布结论。

所述的决策树是指:对于每一个信息发布用户,针对每一个信息发布位对应的属性包括: 对于信息发布用户Si,有受众类别属性、信息类别属性、信息长度属性、信息情绪属性、信息 发布位置属性以及发布结论属性,并根据上述信息建立并训练得到不同用户唯一对应的决策树。

所述的实时信息分析单元包括:信息检测单元、实时信息特征分析单元、互联网发布信 息分析单元、发布信息内容分析单元、用户分析单元和数据存储单元,其中:信息检测单元检 测并识别对于同一互联网发布信息,不同时间由不同的用户进行成功信息发布的结果;实时信 息特征分析单元预测各用户对同一互联网发布信息在不同时间的网络行为;互联网发布信息分 析单元获取互联网发布信息本身的属性信息;发布信息内容信息分析单元获取用户所投放互联 网信息的属性信息;数据存储单元存储实时信息特征分析单元、互联网发布信息分析单元、发 布信息内容分析单元、用户分析单元、用户分析单元所生成的数据。

所述的用户分析单元包含用户定向信息分析单元与用户行为分析单元,其中:用户定向 信息分析单元确定浏览或点击发布信息的用户的属性信息;用户行为分析单元定向单个用户的 行为,且根据单个用户的分析行为,得到不同类别用户的分析行为。

所述的互联网发布信息本身的属性信息包括:互联网发布信息的尺寸、大小、位置。

所述的用户所投放互联网信息的属性信息包括:投放互联网信息的素材,互联网信息色 彩,互联网信息类别。

所述的用户定向信息分析单元获取每次信息发布成功的投放用户信息,例如用户类别, 用户规模,发布信息投放时间,发布信息投放地点信息。

所述的预测分析单元包括:信息发布用户预测单元、行为预测单元及预测规则库,其中:

信息发布用户预测单元根据历史发布的信息以及预测规则库中预存的规则预测得到可能发布 该信息的用户,行为预测单元根据预测规则库中预存的规则预测可能发布信息的行为。

所述的实时信息发布处理单元包括:自信息发布预测单元、其他信息发布用户预测单元、 关注对象数据库和信息发布结果融合单元,其中:自信息发布预测单元根据本信息发布用户的 历史行为进行预测,生成预测结果;其他信息发布用户预测单元根据本信息发布用户对其他用 户行为进行预测,生成推荐结果;用户根据自身的业务逻辑事先建立关注对象数据库,当其他 信息发布用户预测单元输出的用户存在于关注对象的数据库中,则对该用户进行信息发布预测 分析,预测得到该用户的推荐结果;信息发布结果融合单元将自信息发布预测结果与其他用户 信息发布进行融合输出最终的实时信息发布结果。

技术效果

与现有技术相比,本发明可以根据输入的不同用户的互联网信息特征数据信息进行自动 的检测与分析;可以根据互联网发布信息的尺寸、大小、位置对互联网发布信息属性进行分析; 可以对发布信息投放内容,素材,互联网信息色彩,互联网信息类别进行分析;可以根据用户 所传递不同信息对浏览发布信息的用户进行定向,并对用户的行为进行分析,并可以根据用户 行为对用户进行分类;可以根据不同用户的信息对可能的信息发布进行预测;可以根据针对不 同的用户及可能潜在的不同的用户进行实时信息发布预测。

附图说明

图1是本发明实时推荐预测发布信息装置的示意图。

图2是本发明数据处理服务器的示意图。

图3是本发明实时信息分析单元的示意图。

图4是本发明预测分析单元的示意图。

图5是本发明信息发布预测决策树的示例图。

图6是本发明实时应用服务器的示意图。

图7是本发明实时信息发布处理单元的示意图。

具体实施方式

下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施, 给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例1

如图1所示,本实施例装置包括:数据处理服务器101以及实时应用服务器102,其中: 数据处理服务器101训练来自各用户及浏览用户的数据信息,实时应用服务器102浏览用户在 实时浏览网站时的互联网信息特征数据或向用户输出相关分析结果。

如图2所示,所述的数据处理服务器101包括:输入单元201、存储单元202、中央处 理单元203以及由显示单元204和声音单元205组成的输出单元,其中:输入单元201的输出 端与中央处理单元203连接并传输采集到的网络用户行为信息,中央处理单元203根据网络用 户行为信息生成决策树和训练集,并通过显示单元204和声音单元205以声光方式输出用户行 为分析预测结果、通过存储单元202保存用户对应的决策树和训练集。

所述的网络用户行为信息包括:自网站的互联网发布信息数据、互联网信息内容数据、 互联网信息特征历史数据、用户信息、浏览用户信息数据。

所述的输入单元101可以是多种形式,可以通过爬虫不断读取网络日志,可以从其他数 据库直接输入,可以键盘进行文字输入、也可以通过麦克风进行声音输入或者通过扫描仪进行 图像输入。

如图3所示,所述的中央处理单元203包括:实时信息分析单元301和预测分析单元302, 其中:实时信息分析单元301从输入单元201收到网络用户行为信息并通过解析得到信息发布特 征属性、互联网发布信息、互联网信息内容数据,分别根据其中的信息发布特征属性生成对应 的决策树并分别输出至存储单元202和预测分析单元302,根据其中的互联网信息内容数据进行 用户行为分析并生成预测训练集;预测分析单元302根据决策树和预测训练集对进行决策树训 练以及用户行为预测。

所述的信息发布特征属性包括:受众类别、信息类别、信息长度、信息情绪、信息发布 位置、发布结论。

所述的决策树是指:对于每一个信息发布用户,针对每一个信息发布位,包含很多属性, 例如:对于信息发布用户Si,有受众类别,信息类别,信息长度,信息情绪,信息发布位置, 发布结论等属性:

根据上述信息可以建立并训练针对不同用户的决策树。

如图3所示,所述的实时信息分析单元包括:信息检测单元401、实时信息特征分析单元 402、互联网发布信息分析单元403、发布信息内容分析单元404、用户分析单元405和数据存储 单元406,其中:信息检测单元401检测并识别对于同一互联网发布信息,不同时间由不同的用 户进行成功信息发布的结果;实时信息特征分析单元402预测各用户对同一互联网发布信息在 不同时间的网络行为;互联网发布信息分析单元403获取互联网发布信息本身的属性信息;发 布信息内容信息分析单元404获取用户所投放互联网信息的属性信息;用户分析单元405包含用 户定向信息分析单元与用户行为分析单元,其中:用户定向信息分析单元确定浏览或点击发布 信息的用户的属性信息,例如地点、天气、气温、以及用户喜好、用户类别等信息;用户行为 分析单元不仅可以定向单个用户的行为,并且能够根据单个用户的分析行为,可以得到不同类 别用户的分析行为;数据存储单元406存储实时信息特征分析单元、互联网发布信息分析单元、 发布信息内容分析单元、用户分析单元以及用户分析单元所生成的数据。

所述的互联网发布信息本身的属性信息包括:互联网发布信息的尺寸、大小、位置等。

所述的用户所投放互联网信息的属性信息包括:投放互联网信息的素材,互联网信息色 彩,互联网信息类别等。

所述的用户定向信息分析单元获取每次信息发布成功的投放用户信息,例如用户类别, 用户规模,发布信息投放时间,发布信息投放地点等信息。

所述的用户行为分析单元不仅可以定向单用户的行为,并且能够根据单用户的分析行为, 可以得到不同类别用户的分析行为。

举例说明,表1表示某信息发布商为其用户A针对特定互联网发布信息进行的信息检测, 在T1至Tn的时间内,用户A与不同的其他用户针对该互联网发布信息进行竞价。该互联网发布 信息分别被不同的用户所拍下(1表示信息发布成功,0表示信息发布失败)。

表1

所述的预测是指:对于用户A预测的发布信息内容(包括是否发布信息,以及相关发布 信息的属性如信息类别、信息长度、信息用户、信息情绪等),具体步骤如下:

对同一信息发布位置检测不用的用户发布情况,得到如下检测向量:

S11=(1,0,0,1,0,...,1)

S21=(0,1,0,0,0,...,0)

St1=(0,0,0,1,0,...,0)

其中:每一个向量表示一个信息发布用户在某时间发布信息的序列,1表示发布信息成 功,0表示未成功发布。S的上标表示信息发布位置,下标表示不同的用户。表示信息发布用 户i信息发布位k,不同时间的发布信息情况。与Si行为最接近的用户为St

st=arg{MaxkMaxjCijk(Sik,Sjk)},其中:为的相似性度量。

Cijk(Sik,Sjk)=ΣmSik(m)Sjk(m)(Σm(Sik(m))2)*(Σm(Sjk(m))2)

通过相似度测量找到Si的top-N相似用户对于与Si相似的top-N用 户与Si的决策树一并记录至对应Si的存储单元;通过利用Si与 相似关联用户的决策树得到结果为(c1,c2,….,cn),其中:ci为1或0,i为 1~n中的任一;当得到的1的数量大于0的数量,则向Si推荐投放信息这样的结论;反之,则向Si推荐不投放信息的结论。

例如在表2中,示出了用户地点、性别、关注互联网信息类别、购物喜好属性信息,其 中:数字为各个属性离散化后的数字。经对该部分用户进行协同过滤分类可以得到{用户1, 用户2},{用户3,用户8},{用户4,用户5,用户7,用户11,用户12}。说明{用户1,用户2} 可以为一个类别,他们的行为较为接近。{用户3,用户8},{用户4,用户5,用户7,用户11, 用户12}分别作为两个不同的类别。上述分类方法不限于协同过滤,传统聚类分析等方法完全 可以适用。

表2

所述的用户定向信息分析单元获取每次信息发布成功的投放用户信息,例如用户类别, 用户规模,发布信息投放时间,发布信息投放地点等信息。

所述的用户行为分析单元不仅可以定向单用户的行为,并且能够根据单用户的分析行为, 可以得到不同类别用户的分析行为。

例如在表3中,示出了用户类别、用户规模、发布信息投放时间,发布信息投放地点, 其中:数字为各个属性离散化后的数字。经对该部分用户进行协同过滤分类可以得到{用户1, 用户2},{用户3,用户8},{用户4,用户5,用户7,用户11,用户12}。说明{用户1,用户2} 可以为一个类别,他们的行为较为接近。{用户3,用户8},{用户4,用户5,用户7,用户11, 用户12}分别作为两个不同的类别。上述分类方法不限于协同过滤,传统的聚类分析等方法完 全可以适用。

表3

所述的预测分析单元302包括:用户预测单元501、行为预测单元502及预测规则库, 其中:数据存储单元406存储实时信息分析单元301生成的预测训练集。根据数据存储单元406 提供的用户数据,由用户预测单元501进行处理得到用户预测规则,并存储至预测规则库503。 根据数据存储单元406提供的价格数据,由行为预测单元502进行处理得到价格预测规则,并 存储至预测规则库503。

如图4所示,所述的预测分析单元302包括:信息发布用户预测单元501、行为预测单 元502及预测规则库503,其中:信息发布用户预测单元501根据历史发布的信息以及预测规 则库503中预存的规则预测得到可能发布该信息的用户,行为预测单元502根据预测规则库503 中预存的规则预测可能发布信息的行为。

如表A4所示的输入为本发明信息发布的历史数据。在这里以决策树的方法,对表A4 中的数据进行分析。

表A4

例如,对于4个条件属性指标,类别属性为信息发布用户,共有n个历史数据:

(T1,A1,B1,C1,P1)

(T2,A2,B2,C2,P2)

(Tn,An,Bn,Cn,,Pn)

通常由于各属性的性质不同,标度不同,为避免数据稀疏,往往需要进行离散化处理, 在这里简单的对各属性按照均匀空间进行离散化新的序列,

(T1′,A1′,B1′,C1′,P1)

(T2′,A′2,B′2,C2′,P2)

(Tn′,A′n,B′n,Cn′,Pn)

对上述数据构建决策树,图5示出了生成决策树的一部分。

当发现在时间T1,点击率为A2,互联网发布信息置为B3,关键字为C9,首先对该属 性进行离散化,得到T1′,A′2,B′3,C9′。将T1′,A′2,B′3,C9′输入至A5决策树中,得到 ,因此最终确定在时间T1,点击率为A2,互联网发布信息置为B3,关键 字为C9的用户为P5

如图6所示,所述的实时应用服务器102包括:互联网用户识别单元701、实时信息发 布处理单元702以及信息发布预测推荐结果输出单元703,其中:互联网用户识别单元701定 向以往登录的用户,实时信息发布处理单元702根据互联网用户识别单元701识别出的用户从 数据处理服务器101的存储单元202中的训练结果中提取相应的预测推荐结果并进行相应的处 理,预测推荐结果输出单元703则将最终的预测推荐结果进行输出。

如图7所示,所述的实时信息发布处理单元702包括:自信息发布预测单元801、其他 信息发布用户预测单元802、关注对象数据库803和信息发布结果融合单元804,其中:自信 息发布预测单元801根据本信息发布用户的历史行为进行预测,生成预测结果;其他信息发布 用户预测单元802根据本信息发布用户对其他用户行为进行预测,生成推荐结果;用户根据自 身的业务逻辑事先建立关注对象数据库803,当其他信息发布用户预测单元802输出的用户存 在于关注对象的数据库803中,则对该用户进行信息发布预测分析,预测得到该用户的推荐结 果;信息发布结果融合单元804将自信息发布预测结果与其他用户信息发布进行融合输出最终 的实时信息发布结果804。

例如:用户A根据发布信息输入属性进行自信息发布预测结果为发布成功,由其他信息 发布用户预测单元预测用户B将进行竞争信息发布。由于用户B位于用户A的竞争对手的数 据库中。其它用户信息发布预测单元输出发布信息B也可能信息发布会成功,为避免在该互联 网发布信息失去发布信息的机会,用户A将对原有拟发布信息(如信息类别,信息长度、信息 价格等)进行修改并重新预测直到预测用户A发布成功,而用户B发布不成功。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号