首页> 中国专利> 一种低成本高光谱海量数据并行处理系统

一种低成本高光谱海量数据并行处理系统

摘要

一种低成本高光谱海量数据并行处理系统,由前端服务器、计算服务器、存储服务器、内部交换网络、外部交换网络、键盘/显示器/鼠标(Keyboard Video Mouse,KVM)切换器、终端组成,内部交换网络连接前端服务器、计算服务器和存储服务器,用户通过外部交换网络与前端服务器连接,两套终端监视系统运行状态,系统采用Beowulf集群架构,通过虚拟存储技术提供数据的并行访问,实现并行计算、资源监测和作业管理功能。本发明具有计算效率高、I/O带宽高、成本低等优点,对高光谱地面运营系统的研制具有重要价值。

著录项

  • 公开/公告号CN101621537A

    专利类型发明专利

  • 公开/公告日2010-01-06

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN200910089806.1

  • 发明设计人 赵慧洁;董超;王维;李娜;贾国瑞;

    申请日2009-07-24

  • 分类号H04L29/08;

  • 代理机构北京慧泉知识产权代理有限公司;

  • 代理人王顺荣

  • 地址 100191 北京市海淀区学院路37号北航仪器科学与光电工程学院

  • 入库时间 2023-12-17 23:18:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-09-10

    未缴年费专利权终止 IPC(主分类):H04L29/08 授权公告日:20120905 终止日期:20130724 申请日:20090724

    专利权的终止

  • 2012-09-05

    授权

    授权

  • 2010-07-14

    实质审查的生效 IPC(主分类):H04L29/08 申请日:20090724

    实质审查的生效

  • 2010-01-06

    公开

    公开

说明书

技术领域

本发明涉及一种低成本高光谱海量数据并行处理系统,用于高光谱海量数据的快速处理,特别适用于对时效性要求较高的应用场合,属于高光谱数据处理与应用技术领域。

背景技术

随着传感器空间分辨率、光谱分辨率的不断提高,高光谱遥感显示了其它遥感手段无法比拟的技术优势,它既对目标成像、又可以测量目标波谱特征,实现目标特性的综合探测与识别,大大扩宽了遥感技术的应用领域。但高光谱数据波段多、数据量大,处理系统的计算效率成为制约高光谱载荷有效应用的瓶颈。如对环境建模与评估、军事目标探测、森林火灾监测、生物危机监测、化学污染和石油井喷监控,这些应用领域对系统响应时间非常敏感,对处理系统的计算效率提出了非常高的要求。

并行计算技术发展至今,已成功解决部分数据密集型场合的应用问题,在高光谱海量数据处理领域也取得了初步成果,但仍存在以下三方面的缺陷。首先,传统处理系统多采用对称多处理器(Symmetric Multiple Proc-essor,SMP)、大规模并行处理机(Massively Parallel Processor,MPP)架构,这类系统技术起点高、使用难度大、成本高,不适合技术、资金较薄弱的部门使用。其次,海量数据处理对系统存储模块的性能要求较高,多采用网络接入存储(Network Access Server,NAS)或存储区域网络(StorageArea Network,SAN)解决,由于NAS和SAN包含光纤、小型计算机系统接口(Small Computer Systems Interface,SCSI)硬盘等高端设备,进一步提高了系统的使用门槛。最后,高端处理系统多使用商业软件,购买各种软件不仅费用高,且使用、维护难度大,对使用者的专业技能要求较高。针对上述问题,本发明提出一种低成本高光谱海量数据并行处理系统。

发明内容

本发明的目的在于提供一种低成本高光谱海量数据并行处理系统,以克服现有高光谱数据处理系统成本过高的缺点,构建一种低成本、高计算效率、高I/O带宽的高光谱海量数据并行处理系统。

本发明的技术解决方案是:一种低成本高光谱海量数据并行处理系统,由前端服务器、计算服务器、存储服务器、内部交换网络、外部交换网络、键盘/显示器/鼠标切换器(即KVM切换器)、终端组成。其中,内部交换网络为千兆以太网,连接前端服务器、计算服务器和存储服务器;外部交换网络为百兆以太网,用户通过外部交换网络与前端服务器连接,用户经该外部交换网络登录系统、传输数据;两套终端监视系统运行状态,计算服务器和存储服务器通过键盘/显示器/鼠标切换器(即KVM切换器)共享一套终端。

系统采用Beowulf集群架构,前端服务器、计算服务器、存储服务器内各节点为个人电脑(PC),并通过并行虚拟文件系统(Parallel Virtual FileSystem,PVFS)实现数据的并行访问。

用户通过安全外壳协议访问前端服务器(5),使用文件传输协议与存储服务器(6)进行数据传输。

前端服务器安装并行虚拟文件系统元数据服务(Metadata Server,mgr)进程,存储服务器安装并行虚拟文件系统数据服务(I/O Server,iod)进程,计算服务器安装并行虚拟文件系统库(Parallel Virtual File System NativeAPI,Iibpvfs),前端服务器mgr进程生成数据索引目录,计算服务器通过libpvfs与mgr进程交互,获取数据分布信息,然后与存储服务器iod进程建立连接,读写远程数据。

软件系统基于Rocks软件包,实现并行计算、资源监测和作业管理功能。首先在前端服务器上安装Rocks软件系统各功能模块,然后通过KickStart实现计算服务器、存储服务器操作系统和软件的自动化安装。计算服务器和存储服务器通过简单文件传输协议(Trivial File Transfer Protocol,tftp)从前端服务器获取安装配置文件,然后经网络文件系统(Network File System,NFS)下载软件包,安装结束后,计算服务器和存储服务器的信息被写入系统数据库。

本发明的原理是:利用PC、以太网等商用设备组建Beowulf集群,通过Rocks实现系统的集中管理;使用PVFS软件包组建存储服务器,将大文件分布地存储在各存储节点内,通过虚拟存储技术提高系统的数据访问能力,消除I/O瓶颈;通过KVM切换器和两套终端设备监控系统资源状态,一套终端直接连接在前端服务器,另一套终端通过KVM切换器在计算服务器和存储服务器分时复用;外部用户通过百兆交换网络访问前端服务器、提交处理任务,前端服务器根据系统的资源状态自动为用户请求分配作业和资源。

本发明与现有技术相比的优点在于:(1)系统采用Beowulf集群架构,通过PC、以太网等廉价设备组建并行处理平台,获得近似高端并行处理系统的计算性能,同时最小化成本,降低高光谱海量数据地面处理系统研制的前期投入。(2)通过PVFS缓解系统I/O瓶颈,存储服务器由IDE硬盘和以太网等廉价硬件构成,避免了NAS和SAN中光纤、SCSI硬盘使用难度大、成本高的缺点。(3)使用Rocks软件包实现操作系统、各种应用软件的自动安装、配置与维护,节省了高端系统中商业软件的开销,且避免了系统管理过程中繁琐的重复性工作,降低了使用门槛,对管理员和使用者无太多专业知识要求。

附图说明

图1为本发明的结构框架图;

图2为本发明的系统软件配置示意图;

图3为本发明的并行I/O访问示意图;

图4为本发明的系统使用方法示意图。

具体实施方式

如图1所示,本发明包括前端服务器5、计算服务器1、存储服务器6、内部交换网络7、外部交换网络4、KVM切换器2、终端3,其中内部交换网络7为千兆以太网,连接前端服务器5、计算服务器1和存储服务器6;外部交换网络4为百兆以太网,用户通过该网访问系统资源;系统包含两套终端3,计算服务器1和存储服务器6通过KVM切换器2共享一套终端,另一套终端连接前端服务器5。系统采用Beowulf集群架构,前端服务器5、计算服务器1、存储服务器6内各节点为PC,实施过程中各节点包含主频2.0G 64位单核心处理器、1G内存、80G硬盘和千兆以太网卡。

如图2所示,本发明的系统软件安装流程为:前端服务器5安装Rocks软件包,包括Linux操作系统、并行计算软件包、资源监测软件、SUN网格引擎(Sun Grid Engine,SGE)作业管理软件等,并设置主机名、IP地址、域名等关键系统参数,开启节点安装服务51、tftp服务52和NFS服务53;计算服务器1和存储服务器6内的子节点安装时,首先向节点安装服务51发送安装请求,通过审核后从tftp服务52下载安装配置文件,然后根据配置信息从NFS服务53下载相应的软件包进行安装,安装结束后向前端服务器5发送信号以更新集群信息数据库54的内容;计算服务器1和存储服务器6内的所有节点依次执行上述过程,直到所有节点完成安装。

如图3所示,本发明中采用PVFS解决海量数据存储问题。PVFS为计算机领域的公知技术,是虚拟存储技术的一种实现方式,通过将文件分布地存储在不同节点内提高数据读/写效率。前端服务器5安装PVFS元数据服务进程mgr,生成真实数据的索引目录;存储服务器6内各节点安装I/O后台服务iod进程,负责真实数据的传输;计算服务器1通过Iibpvfs库函数,实现远程数据在本地的浏览和修改。计算服务器1首先通过IibpVfs与mgr交互,查找索引目录、获取远程数据的真实分布信息,然后与相应的iod进程建立连接,进行数据传输。如上所述,存储服务器6内各节点的本地存储介质被整合为一个大容量、并发读写的虚拟硬盘,对外提供并行I/O服务。

如图4所示,本发明的系统使用方法为:用户通过ssh服务55远程登陆前端服务器5,经索引目录57浏览存储服务器6虚拟硬盘的内容,使用FTP服务58向存储服务器6传输待处理数据;用户使用SGE作业管理系统56向系统提交处理请求,SGE调用内部资源管理模块,根据计算服务器1的工作状态将用户请求插入作业队列并分配计算资源;用户可通过SGE作业管理系统56查询任务执行状态,完成后可通过FTP服务58将结果下载到本地硬盘。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号