基于Hadoop的非结构化数据管理在离散制造业中的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来离散制造企业高度重视信息化的建设，经过几年的发展，已初具成效。在几年的业务发展中，企业内产生了大量的信息化数据，包括办公文档、业务订单、数据报表、图片、音频、视频等信息。企业通常采用的提取有效信息存储到数据库，将原文件保存到磁盘的方式，一定程度解决了企业数据管理的问题。但是随着数据量的急剧增长，对这些非结构化数据合理有效的管理与利用成了企业面临的一个新的大问题，也是增强企业国际竞争力的一个关键。
　　本文以某离散制造企业内非结构化数据管理系统为背景，结合当前流行的hadoop分布式框架，设计实现了基于hadoop的非结构化数据管理系统。在研究此离散制造业非结构化数据的过程中发现企业内文件大小较小，以及hadoop在存储小文件需要相关人员定期手工进行小文件合并难的问题，通过分布式数据库hbase中计数器的合理利用，在企业进行非结构化数据存储时提出了一种基于hbase的小文件自动归档合并策略；其次，为了克服以往将原文档直接保存到磁盘无法进行按内容查找的问题，本文利用lucene全文检索引擎技术工具包，设计了一种在hadoop环境下基于lucene的全文内容检索策略；最后，将此非结构化数据管理系统应用到某离散制造业现有的管理系统中，解决企业在原有系统中大量附件上传带来的文件存储安全与文件备份、查找等问题。
　　在本文设计实现的非结构化数据管理系统中，通过对某离散制造企业多年办公文档的存储管理，可以看到此系统一方面通过小文件自动归档合并，解决了hadoop进行小文件存储影响系统性能的问题；另一方面通过lucene全文检索引擎方便了用户通过文档内容进行文档检索，提高了办公效率；通过与企业内原有的系统整合，解决了原系统在附件管理中存在的问题。

著录项

作者
赵振华;
展开▼
作者单位

河北工业大学;

展开▼
授予单位河北工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名林涛;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类办公自动化系统;
关键词
非结构化数据; 数据管理; 离散制造业; hadoop框架; 检索引擎;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop的非结构化数据管理在石油行业中的研究与实现 [J] . 张学伟 . 数字技术与应用 . 2017,第005期
2. 基于Hadoop的非结构化数据管理在石油行业中的研究与实现 [J] . 张学伟 . 数字技术与应用 . 2017,第005期
3. 浅谈基于Hadoop非结构化数据管理体系在采油厂中应用 [J] . 王琪 . 电脑知识与技术 . 2021,第029期
4. Hadoop分布式框架下石油行业非结构化数据管理实现策略探究 [J] . 孙晓萍 . 中国管理信息化 . 2020,第007期
5. 电网非结构化数据管理平台研究与实现 [J] . 冯国平 ,古明生 ,吉小恒 . 南方能源建设 . 2015,第0z1期
6. 非结构化数据管理技术在岩石物理实验数据库中的应用 [C] . YU Chunhao ,余春昊 ,LI Guojun . 第五届CNPC测井重点实验室学术交流会 . 2012
7. ORM技术在图书馆非结构化数据管理中的应用研究 [A] . 肖湘芳 . 2006

基于Hadoop的非结构化数据管理在离散制造业中的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅