公开/公告号CN104766368A
专利类型发明专利
公开/公告日2015-07-08
原文格式PDF
申请/专利权人 成都康赛信息技术有限公司;
申请/专利号CN201510188682.8
发明设计人 马晨曦;
申请日2015-04-20
分类号
代理机构成都宏顺专利代理事务所(普通合伙);
代理人周永宏
地址 610054 四川省成都市一环路东一段159号电子信息产业大厦410室
入库时间 2023-12-18 09:48:08
法律状态公告日
法律状态信息
法律状态
2017-09-26
授权
授权
2015-08-05
实质审查的生效 IPC(主分类):G06T17/00 申请日:20150420
实质审查的生效
2015-07-08
公开
公开
技术领域
本发明属于计算机数据访问与管理技术领域,具体涉及一种基于元胞自动机的信息门户 自动构建以及动态构建方法的设计。
背景技术
门户(portal),原意是指正门、入口,现多用于互联网的门户网站、移动互联网的门 户网站和企业应用系统的门户系统,是指集成了多样化内容服务的Web站点,又称为网络门 户。目前,传统的门户主要是将组织中各个分散的应用系统产生的数据以及逻辑关联的关系 进行整合和集成,以统一的界面和交互规则进行集中呈现。然而,随着互联网技术,特别是 大数据分析技术的蓬勃发展,用户对信息的精确获取以及个性化体验需求不断提高。传统的 依靠指定管理员或者用户自行手动定制门户的方式在数据呈现的及时性上已经明显滞后,无 法及时、主动的根据用户需求进行调整。
元胞自动机(Cellular Automaton,复数为Cellular Automata),简称CA,又称为细胞自动 机、点格自动机、分子自动机或单元自动机。它是一种在时间和空间上都离散的动力系统, 其工作原理为:散布在规则格网(Lattice Grid)中的每一元胞(Cell)取有限的离散状态,遵循同 样的作用规则,依据确定的局部规则作同步更新。大量元胞通过简单的相互作用从而构成动 态系统的演化。
发明内容
本发明的目的是为了解决现有技术中信息门户在数据呈现的及时性上已经明显滞后,无 法及时、主动的根据用户需求进行调整的问题,提出了一种基于元胞自动机的信息门户自动 构建以及动态构建方法。
本发明的技术方案为:一种基于元胞自动机模型的信息门户自动构建方法,包括以下步 骤:
S1、构建以用户访问频率为基准的元胞自动机模型网格图M1;
S2、构建以功能关联强度为基准的元胞自动机模型网格图M2;
S3、对M1和M2进行合并计算,得到混合网格图M3;
S4、根据混合网格图M3构建输出页面,完成信息门户的自动构建。
进一步地,步骤S1具体包括以下分步骤:
S11、录入门户平台的所有功能模块;
S12、构建方形二维网格图M,使其中的每一个格子对应门户平台中的一个功能模块;
S13、录入用户对每个功能模块访问频率的历史记录;
S14、根据用户对每个功能模块访问频率的历史记录对M中的格子进行重新排列,以此 构建以用户访问频率为基准的元胞自动机模型网格图M1。
进一步地,步骤S14具体为:
将访问频率越高的功能模块对应的格子设置到越靠近方形网格中心的位置,将访问频率 越低的功能模块对应的格子设置到越远离方形网格中心的位置,形成三维堆积网格图,图中 每个格子的高度为一个以数值表示的频率强度;所述三维堆积网格图即为以用户访问频率为 基准的元胞自动机模型网格图M1。
进一步地,步骤S2具体包括以下分步骤:
S21、录入门户平台的所有功能模块;
S22、构建方形二维网格图M,使其中的每一个格子对应门户平台中的一个功能模块;
S23、设定有限个数的约束条件P,定义各个功能模块之间的约束关系;
S24、根据约束条件P计算每个功能模块与其它模块的关联强度;
S25、根据步骤S24的计算结果对M中的格子进行重新排列,以此构建以功能关联强度 为基准的元胞自动机模型网格图M2。
进一步地,步骤S25具体为:
将与其它模块的关联强度越高的功能模块对应的格子设置到越靠近方形网格中心的位 置,将与其它模块的关联强度越低的功能模块对应的格子设置到越远离方形网格中心的位置, 得到以功能关联强度为基准的元胞自动机模型网格图M2。
进一步地,步骤S3具体为:
同时对M1和M2从网格中心点开始,选择满足页面构建需要功能数量且半径最小的子集 M11和M21,再对M11和M21进行合并计算,得到满足选取的格子对应的功能模块访问频率最 高,同时与其它模块的关联强度尽可能高的混合网格图M3。
进一步地,步骤S4具体为:
根据混合网格图M3中格子的序列,选取门户平台中对应的功能模块,将其转换为实际的 输出页面,从而完成信息门户的自动构建。
本发明还提供了一种基于元胞自动机模型的信息门户动态构建方法,包括以下步骤:
S1、构建以用户访问频率为基准的元胞自动机模型网格图M1;
S2、构建以功能关联强度为基准的元胞自动机模型网格图M2;
S3、对M1和M2进行合并计算,得到混合网格图M3;
S4、根据混合网格图M3构建输出页面,完成信息门户的自动构建;
S5、重复步骤S1-S4,实现信息门户的动态构建。
本发明的有益效果是:本发明可自动计算满足约束条件的最优功能组合,同时可以保证 用户的访问频率最高,通过周期性的迭代运算和组合,可以实现根据用户访问量动态构建个 性化的信息门户。用户或管理者不再需要长期对门户功能的排列组合进行大量繁琐的手动操 作,系统将根据元胞自动机模型动态地为用户提供最需要的功能组合,并形成页面提供给使 用者。
附图说明
图1为本发明提供的一种基于元胞自动机的信息门户自动构建方法流程图。
图2为本发明步骤S1的分步骤流程图。
图3为本发明步骤S2的分步骤流程图。
图4为元胞自动机演算示意图。
图5为本发明提供的一种基于元胞自动机的信息门户动态构建方法流程图。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
本发明提供了一种基于元胞自动机模型的信息门户自动构建方法,如图1所示,包括以 下步骤:
S1、构建以用户访问频率为基准的元胞自动机模型网格图M1;
该步骤具体包括以下分步骤:
S11、录入门户平台的所有功能模块;
S12、构建方形二维网格图M,使其中的每一个格子对应门户平台中的一个功能模块;
该方形二维网格即为元胞自动机自动演算的范围。
S13、录入用户对每个功能模块访问频率的历史记录;
S14、根据用户对每个功能模块访问频率的历史记录对M中的格子进行重新排列,以此 构建以用户访问频率为基准的元胞自动机模型网格图M1。
该分步骤具体为:将访问频率越高的功能模块对应的格子设置到越靠近方形网格中心的 位置,将访问频率越低的功能模块对应的格子设置到越远离方形网格中心的位置,形成三维 堆积网格图,图中每个格子的高度为一个以数值表示的频率强度;所述三维堆积网格图即为 以用户访问频率为基准的元胞自动机模型网格图M1。
S2、构建以功能关联强度为基准的元胞自动机模型网格图M2;
该步骤具体包括以下分步骤:
S21、录入门户平台的所有功能模块;
S22、构建方形二维网格图M,使其中的每一个格子对应门户平台中的一个功能模块;
该方形二维网格即为元胞自动机自动演算的范围。
S23、设定有限个数的约束条件P,定义各个功能模块之间的约束关系;
这里的约束关系可以为共同出现或者排它等。
S24、根据约束条件P计算每个功能模块与其它模块的关联强度;
这里在计算时,每个约束条件以一个数值表示某个功能模块与其它模块的关联强度,数 值大小与关联强度高低可以为正相关或者负相关。
S25、根据步骤S24的计算结果对M中的格子进行重新排列,以此构建以功能关联强度 为基准的元胞自动机模型网格图M2。
该分步骤具体为:将与其它模块的关联强度越高的功能模块对应的格子设置到越靠近方 形网格中心的位置,将与其它模块的关联强度越低的功能模块对应的格子设置到越远离方形 网格中心的位置,得到以功能关联强度为基准的元胞自动机模型网格图M2。
本发明实施例中,采用的具体方法为:设定阈值对每个功能模块与其它模块的关联强度 进行判定,关联强度值大于阈值则判定为关联强度高,反之则判定为关联强度低。然后将判 定结果中与其它模块的关联强度高的功能模块对应的格子设置为“活细胞”,与其它模块的关 联强度低的功能模块对应的格子设置为“死细胞”。将“活细胞”自动聚集形成如图4所示的 集合簇,然后再将分散的集合簇根据关联强度值进行排序,集中在网格的中心,形成以功能 关联强度为基准的元胞自动机模型网格图M2。
S3、对M1和M2进行合并计算,得到混合网格图M3;
该步骤具体为:同时对M1和M2从网格中心点开始,选择满足页面构建需要功能数量且 半径最小的子集M11和M21,M11即为访问频率最高的功能子集,M21即为与其它模块的关联 强度最高的功能子集。然后再对M11和M21进行合并计算,得到混合网格图M3。M3需满足 功能模块访问频率最高,同时与其它模块的关联强度尽可能高这两个条件。
本发明实施例中,采用隐含马尔可夫模型来对M11和M21进行合并计算:
从M11中选取固定维度的与其它模块的关联强度相对较高的若干模块组合,可以为二维, 三维或更高维度(维度越高越精确,计算复杂度越高,但计算方式相同)。为了简化说明,便 于理解本专利的模型计算方法,此处以二维,即两个模块的组合作为例:
假设选取出与其它模块的关联强度相对较高的三个模块A,B,C,将其两两组合,并标注 其在M21中观查到的访问频率占比,如下表所示:
对于M11,反映到真实页面即为A,B,C3个模块在任意长度下的任意排列组合,在二维 组合的情况下,根据马尔科夫链理论,这些组合所有可能取值的集合,可以视为模型的“状 态空间”,在此维度下,排列组合中每一个模块之间的访问频率占比和仅与相邻的模块有关。 我们可以按照马尔科夫链的计算方式来估算和预测每种模块排列组合方式下的总访问频率占 比(通常来讲,一个网页的模块总数量是相对固定的,则仅需要计算固定长度模块排列组合 中总访问频率占比最高的组合)。
那么,采用马尔可夫模型我们便可以计算包含ABC三个模块组合,且满足页面构建需要 的全部模块随机组合的总访问频率占比,例如组合ccaacac的访问频率总占比为:
P(O|M)=p(c)*p(c|c)*p(c|c)*p(a|c)*p(a|a)*p(c|a)*p(a|c)*p(c|a)
=1*0.8*0.8*0.1*0.4*0.3*0.1*0.3
=0.0002304
从全部组合中获取频率总占比最高的组合,即可得到混合网格图M3。
S4、根据混合网格图M3构建输出页面,完成信息门户的自动构建。
该步骤具体为:根据混合网格图M3中格子的序列,选取门户平台中对应的功能模块,将 其转换为实际的输出页面,从而完成信息门户的自动构建。
本发明还提供了一种基于元胞自动机模型的信息门户动态构建方法,如图5所示,包括 以下步骤:
S1、构建以用户访问频率为基准的元胞自动机模型网格图M1;
S2、构建以功能关联强度为基准的元胞自动机模型网格图M2;
S3、对M1和M2进行合并计算,得到混合网格图M3;
S4、根据混合网格图M3构建输出页面,完成信息门户的自动构建;
步骤S1-S4与上述基于元胞自动机模型的信息门户自动构建方法中的步骤S1-S4相同。
S5、重复步骤S1-S4,实现信息门户的动态构建。
在实际应用中,通过不断重复步骤S1-S4,将每次构建后的用户访问数据作为下一次构 建的历史数据输入,通过周期性的迭代运算和组合,从而实现根据用户访问频率动态构建个 性化的信息门户。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原 理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术 人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和 组合,这些变形和组合仍然在本发明的保护范围内。
机译: 一种基于字典类型的字典自动构建方法,其记录介质及基于字典类型的字典自动构建方法
机译: 基于首字母缩略词类型自动构建首字母缩略词词典的方法,其记录介质以及基于首字母缩略词类型的自动构建缩略词词典的装置
机译: 基于附件的自动构建电子邮件通信能力的自动构建方法及其装置