基于Spark的情报大数据可视化分析

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

信息化时代数据量激增，同时由于情报部门等特殊需求部门多年来对信息的积累，存储了大量结构化、半结构化数据，由于受技术水平、创新意识、支撑保障等诸多因素影响，出现不同程度的信息壁垒，信息共享度、利用率不高，如何利用这些情报数据掌握社会动向、分析事态的演化趋势，进而提前预警预测，并为决策者提出决策性的建议，尚有大量知识需要研究。
　　大数据技术经过多年的发展和完善已经趋于成熟，使用大数据技术进行情报分析，可有效的利用数据，为决策者提供可靠的指引。通过对信息的采集、整合并辅以大数据技术，大力推进相关部门的信息化建设。利用Spark运行在内存中的特点，为使用者提供高效的、交互式的查询和计算，快速展现数据内在信息，提高情报机关工作效率。本系统以Spark、Hadoop大数据技术为基础，面向特殊应用信息库、各情报资源信息库等已有数据库或其他多种类型数据文件，辅以GraphX图计算框架、Spark RDD、SparkSQL等工具，进行快速、高效的信息查询和多种图形化展示，并为使用者提供对社区人群的分析、通话分析、人员关联查询等多种功能。
　　本文主要工作内容如下:
　　1、研究情报系统业务模型，以及情报、特殊部门的具体需求分析，研究Spark、Hadoop大数据分析与存储技术、基于J2EE的前端系统、分布式消息系统以及数据清洗和数据库使用等，并设计了情报大数据分析系统的一种实现方法。
　　2、开发前端系统使用J2EE技术架构，搭载Spring、SpringMVC、Mybatis三大框架作为前端展示系统。其中视图层采用FreeMarker、JQuery EasyUI、ECharts等组件提供多种形式、直观的数据展示。使用Oracle数据库，为面端组件、用户名、密码等信息提供持久化服务。
　　3、分布式计算和传输系统开发。前端展示系统通过Apache Kafka集群与Spark集群进行实时交互。Spark集群主要负责对数据进行计算、分析。通过使用SparkRDD、Spark SQL、GrpahX、GraphFrame等工具进行社区发现、重点人员查找、话单分析、人群分析等功能，并将结果通过Kafka集群实时的反馈给前端展示系统。
　　4、数据清洗和导入工作。数据存储采用分布式系统存储，并支持多种数据来源的导入，如关系型数据库、文本文档、CSV文件等。经过数据清洗后统一存放在HDFS系统中。通过Sqoop实现对存储系统定时更新的功能，在固定时间间隔将外部数据导入到存储系统中，保证数据的实时有效性。
　　大数据分析系统通过将分散在不同业务部门的信息通过汇总、提取、计算实现了部门之间的信息交换，打破信息壁垒，并提供高效、直观、多样的数据可视化处理，为情报机关工作效率和能力的提高发挥积极作用。

著录项

作者
李筱川;
展开▼
作者单位

山东大学;

展开▼
授予单位山东大学;
学科电子与通信工程
授予学位硕士
导师姓名朱雪梅;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类情报工作自动化、网络化;
关键词
大数据可视化; 情报系统; Spark技术; 图计算; 功能模块;

相似文献

中文文献
外文文献
专利

1. 大数据背景下我国图书情报领域定量研究现状的可视化分析 [J] . 沈玖玖 ,杨晓月 . 图书馆 . 2017,第006期
2. 多维度视角下学科主题演化可视化分析方法研究——以我国图书情报领域大数据研究为例 [J] . 刘自强 ,王效岳 ,白如江 . 中国图书馆学报 . 2016,第006期
3. 基于大数据下的Spark快速大数据分析 [J] . 林海 ,王强 ,李英震 . 现代工业经济和信息化 . 2019,第010期
4. 基于HDFS+Spark的时空大数据存储与处理——以智慧无锡时空大数据为例 [J] . 贾旖旎 ,周新民 ,曹芳 . 软件 . 2019,第011期
5. 基于Hadoop和Spark的可扩展性化工类大数据分析系统设计 [J] . 尹旭熙 . 粘接 . 2021,第006期
6. 我国情报学学科与博士点发展的比较研究——21世纪初情报学发文的可视化分析 [C] . Lou Wen ,楼雯 . 2013年第三届全国情报学博士生学术论坛 . 2013
7. 基于科学知识图谱的大数据研究可视化分析 [A] . 路畅 . 2019

基于Spark的情报大数据可视化分析

目录

摘要

著录项

相似文献

相关主题

期刊订阅