首页> 中国专利> 基于众包思想的社交网络大数据采集系统

基于众包思想的社交网络大数据采集系统

摘要

本发明公开了一种基于众包思想的社交网络大数据采集系统,该系统包括:服务端模块、客户端模块、存储子系统模块以及爬虫子系统模块;其中,所述服务端模块是系统控制的核心,控制任务在下发前的一切操作以及结果校验等工作;所述客户端模块置于分布式机器节点中,通过socket套接字与服务端通信,接收服务端模块命令、调用主题爬虫程序等;所述存储子系统模块采用HDFS,具体的数据获取工作由主题爬虫程序使用Http Client对象来模拟浏览器操作完成;所述爬虫子系统模块均为主题爬虫,置于分布式机器节点中,通过Http Client对象模拟浏览器操作实现。本发明方案引入众包思想,并利用了Hadoop分布式文件系统存储结果数据,提高了数据获取速度以及信息检索效率。

著录项

  • 公开/公告号CN110019090A

    专利类型发明专利

  • 公开/公告日2019-07-16

    原文格式PDF

  • 申请/专利权人 广州明领基因科技有限公司;

    申请/专利号CN201711239174.3

  • 发明设计人 祁建明;周峻松;徐继峰;陈墩金;

    申请日2017-12-01

  • 分类号

  • 代理机构

  • 代理人

  • 地址 510610 广东省广州市天河区林和东路281号天伦控股大厦17层自编05单元

  • 入库时间 2024-02-19 11:32:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-16

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号