首页> 中国专利> 一种实现门户网站移动化展现的自动化方法和系统

一种实现门户网站移动化展现的自动化方法和系统

摘要

本发明公开了一种实现门户网站移动化展现的自动化方法和系统,属于门户网站技术领域,包括以下步骤:通过httpClient模拟浏览器访问,采集信息并以xml的格式临时保存;对采集过的信息进行标记;轮询的解析线程自动读取临时文件目录中的xml文件,同时转换为统一的数据格式;将清洗完成后的信息保存在云端服务器上,并清空临时文件;在信息转换系统上创建同步任务,并关联数据转换模板,数据转换模板能够自定义每个字段中任意标签的样式。本发明通过提供导出、导入数据模板功能,能够自动识别模板中的标签样式,数据模板中标签和样式可以自定义,为移动端的页面提供了高度统一的样式风格。

著录项

  • 公开/公告号CN112417353A

    专利类型发明专利

  • 公开/公告日2021-02-26

    原文格式PDF

  • 申请/专利权人 大汉软件股份有限公司;

    申请/专利号CN202011336950.3

  • 发明设计人 金震宇;朱浪;

    申请日2020-11-25

  • 分类号G06F16/958(20190101);G06F16/21(20190101);G06F16/215(20190101);

  • 代理机构

  • 代理人

  • 地址 210042 江苏省南京市玄武区玄武大道699-40号徐庄实训中心

  • 入库时间 2023-06-19 10:02:03

说明书

技术领域

本发明涉及一种自动化方法和系统,特别是涉及一种实现门户网站移动化展现的自动化方法和系统,属于门户网站技术领域。

背景技术

虽然互联网技术早已跃升到移动时代,但因为种种原因,许多大型政府企业的门户系统,仍旧是基于异构的老旧系统开发维护的,对外既没有内容的输出API,也没有数据库直接读取的权限,传统的信息门户没有办法做到移动化的自动转化,需要分别维护门户和移动端的频道和信息,导致维护较多内容重复,浪费资源。

现有技术的缺陷和不足:(1)PC和移动端单独维护,维护成本高;(2)目前对门户网站信息的提取,无法满足移动端展示的规范,往往保留了门户系统中的页面样式风格,在移动端的排版、间距、格式无法达到高度统一;(3)无法根据需要自定义移动端的样式,根据不同的门户网站创建不同的样式模板。

发明内容

本发明的主要目的是为了解决现有技术的不足而提供一种具有高度统一的样式风格和导入数据模板功能的实现门户网站移动化展现的自动化方法和系统。

本发明的目的可以通过采用如下技术方案达到:

一种实现门户网站移动化展现的自动化方法,包括以下步骤:

步骤1:通过httpClient模拟浏览器访问,采集信息并以xml的格式临时保存;

步骤2:对采集过的信息进行标记;

步骤3:轮询的解析线程自动读取临时文件目录中的xml文件,同时转为为统一的数据格式;

步骤4:将清洗完成后的信息保存在云端服务器上,并清空临时文件;

步骤5:在信息转换系统上创建同步任务,并关联数据转换模板,数据转换模板能够自定义每个字段中任意标签的样式;

步骤6:启动信息转换系统上的同步任务,将采集信息同步到信息转换系统上;

步骤7:信息转换系统解析同步过去的xml文件并为每个字段添加自定义的样式,并生成新的xml文件;

步骤8:信息转换系统将信息同步给移动端,移动端在接收到信息后展示。

在步骤1中,通过httpClient模拟浏览器访问,采集门户网站内容页面信息,按前后标识提取对应字段的信息,并将采集信息以xml的格式保存在云端服务器的临时文件目录中。

在步骤2中,将采集过的信息缓存在列表中并根据信息的内容页地址进行标记。

在步骤3中,轮询的解析线程会自动从云端服务器的临时文件目录中读取xml文件,将每个采集项字段转换成DOM树,并清空DOM树上的每个node节点的样式属性,同时统一数据的格式。

信息转换系统能够自定义数据模板,设置标题、链接、发布时间、来源、内容各自对应相关标签的字体、大小以及行间距。

采集信息划分为标题、链接、发布时间、来源和内容五个字段。

一种实现门户网站移动化展现的自动化系统,包括:

信息采集系统,采集门户网站的信息;

数据清洗,对数据进行清洗,去除内容的style样式;

信息转换系统,对每一个栏目中的内容页进行适配模板,为内容添加样式标签,并重组成新的内容页信息;

移动端适配,接收信息转换系统重组后的内容页信息,进行适配展现。

优选的,在信息转换系统中创建关联关系任务,将同一栏目下的内容页与指定模板关联起来。

优选的,信息转换系统为内容添加font-size或者line-height样式标签。

本发明的有益技术效果:按照本发明的实现门户网站移动化展现的自动化方法和系统提供导出、导入数据模板功能,能够自动识别模板中的标签样式,数据模板中标签和样式可以自定义,为移动端的页面提供了高度统一的样式风格;提供对目标网站内网或外网的信息采集,采集的内容被同步到云端,再进行内容清洗和适配,转换成适合在移动端展现的形态,之后由移动客户端进行展现;该系统具备低成本部署、可配置和无需二次开发的特点,适合搬迁政企内部极度分散的老旧内容系统。

附图说明

图1为按照本发明的实现门户网站移动化展现的自动化方法和系统的一优选实施例的信息门户移动化自动化转化流程图。

具体实施方式

为使本领域技术人员更加清楚和明确本发明的技术方案,下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

如图1所示,本实施例提供的实现门户网站移动化展现的自动化方法,包括以下步骤:

步骤1:通过httpClient模拟浏览器访问,采集信息并以xml的格式临时保存;

步骤2:对采集过的信息进行标记;

步骤3:轮询的解析线程自动读取临时文件目录中的xml文件,同时转为为统一的数据格式;

步骤4:将清洗完成后的信息保存在云端服务器上,并清空临时文件;

步骤5:在信息转换系统上创建同步任务,并关联数据转换模板,数据转换模板能够自定义每个字段中任意标签的样式;

步骤6:启动信息转换系统上的同步任务,将采集信息同步到信息转换系统上;

步骤7:信息转换系统解析同步过去的xml文件并为每个字段添加自定义的样式,并生成新的xml文件;

步骤8:信息转换系统将信息同步给移动端,移动端在接收到信息后展示。

在本实施例中,如图1所示,在步骤1中,通过httpClient模拟浏览器访问,采集门户网站内容页面信息,按前后标识提取对应字段的信息,并将采集信息以xml的格式保存在云端服务器的临时文件目录中;在步骤2中,将采集过的信息缓存在列表中并根据信息的内容页地址进行标记,防止重复采集;在步骤3中,轮询的解析线程会自动从云端服务器的临时文件目录中读取xml文件,将每个采集项字段转换成DOM树,并清空DOM树上的每个node节点的样式属性,转换为统一数据的格式,信息转换系统能够自定义数据模板,设置标题、链接、发布时间、来源、内容各自对应相关标签的字体、大小以及行间距;采集信息划分为标题、链接、发布时间、来源和内容五个字段,在步骤4中,将清洗完成后的信息保存在云端服务器上,并清空临时文件,能够更新数据同时减少数据的占用空间。

在本实施例中,如图1所示,一种实现门户网站移动化展现的自动化系统,系统包括:信息采集系统,采集门户网站的信息;数据清洗,对数据进行清洗,去除内容的style样式;信息转换系统,对每一个栏目中的内容页进行适配模板,为内容添加样式标签,并重组成新的内容页信息;移动端,接收信息转换系统重组后的内容页信息,在信息转换系统中创建关联关系任务,将同一栏目下的内容页与指定模板关联起来,信息转换系统为内容添加font-size或者line-height样式标签,提供导出、导入数据模板功能,能够自动识别模板中的标签样式,数据模板中标签和样式可以自定义,为移动端的页面提供了高度统一的样式风格;提供对目标网站内网或外网的信息采集,采集所得的内容被同步到云端,再进行内容清洗和适配,转换成适合在移动端展现的形态,之后由移动客户端进行展现;该系统具备低成本部署、可配置和无需二次开发的特点,适合搬迁政企内部极度分散的老旧内容系统。

在本实施例中,如图1所示,本实施例提供的一种实现门户网站移动化展现的自动化方法和系统的工作过程如下:

步骤1:通过httpClient模拟浏览器访问,采集门户网站内容页面信息,按前后标识提取对应字段的信息,并将采集信息以xml的格式保存在云端服务器的临时文件目录中;

步骤2:将采集过的内容页地址缓存在列表中,防止重复采集;

步骤3:轮询的解析线程会自动从云端服务器的临时文件目录中读取xml文件,将每个采集项字段转换成DOM树,并清空DOM树上的每个node节点的样式属性;

步骤4:将清空完成后的xml文件保存在云端服务器上,并清空临时文件;

步骤5:在信息转换系统上创建同步任务,并关联数据转换模板,数据转换模板可以自定义每个字段中任意标签的样式;

步骤6:启动信息转换系统上的同步任务,将xml文件同步到信息转换系统上;

步骤7:信息转换系统会解析同步过去的xml文件并为每个字段添加自定义的样式,并生成新的xml文件,从而实现移动端页面样式的高度统一;

步骤8:信息转换系统将信息同步给移动端,移动端在接收到信息后做适配展示。

综上所述,在本实施例中,按照本实施例的实现门户网站移动化展现的自动化方法和系统,提供导出、导入数据模板功能,能够自动识别模板中的标签样式,数据模板中标签和样式可以自定义,为移动端的页面提供了高度统一的样式风格;提供对目标网站内网或外网的信息采集,采集所得的内容被同步到云端,再进行内容清洗和适配,转换成适合在移动端展现的形态,之后由移动客户端进行展现;该系统具备低成本部署、可配置和无需二次开发的特点,适合搬迁政企内部极度分散的老旧内容系统,将清洗完成后的信息保存在云端服务器上,并清洗临时文件,能够更新数据同时减少数据占用空间,将每个采集项字段转换成DOM树,并清空DOM树上的每个node节点的样式属性,同时统一数据的格式,自动识别样式并统一数据格式,信息转换系统能够自定义数据模板,设置标题、链接、发布时间、来源、内容各自对应相关标签的字体、大小以及行间距,便于提供高度统一的样式风格,提供相应的内容周边服务如点评、统计、搜索推荐和监控等等,丰富了网站门户的内容,改变传统网站门户的老旧和刻板的形象。

以上所述,仅为本发明进一步的实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明所公开的范围内,根据本发明的技术方案及其构思加以等同替换或改变,都属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号