首页> 中国专利> 一种基于事件驱动的公文数据采集和处理系统及其方法

一种基于事件驱动的公文数据采集和处理系统及其方法

摘要

本发明公开了一种基于事件驱动的公文数据采集和处理系统及其方法,属于大数据技术领域,包括:数据采集服务模块,数据清洗服务模块,数据抽取计算服务模块,数据索引服务模块,日志模块;其采集和处理方法包括:分布式数据采集方式中的分布式爬虫抓取发布在网站上的公文数据,发送给数据采集服务模块处理,在通过数据抽取计算服务模块进行抽取计算,然后通过数据索引服务模块入库存放于数据库中,日志模块记录整个采集与处理过程。本发明采用分布式爬虫进行各个公文发布网站进行抓取,有效解决海量多源异构公文数据的采集和处理时效问题。

著录项

  • 公开/公告号CN110147362A

    专利类型发明专利

  • 公开/公告日2019-08-20

    原文格式PDF

  • 申请/专利权人 中电科大数据研究院有限公司;

    申请/专利号CN201910271964.2

  • 发明设计人 马新凡;王鹏;刘福强;李泽松;

    申请日2019-04-04

  • 分类号

  • 代理机构贵阳睿腾知识产权代理有限公司;

  • 代理人谷庆红

  • 地址 550000 贵州省贵阳市贵阳国家高新技术产业开发区金阳科技产业园黎阳大厦

  • 入库时间 2024-02-19 12:50:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-13

    实质审查的生效 IPC(主分类):G06F16/215 申请日:20190404

    实质审查的生效

  • 2019-08-20

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号