首页> 中文学位 >基于知识库的企业异构数据集成
【6h】

基于知识库的企业异构数据集成

代理获取

目录

文摘

英文文摘

图目录

表目录

第一章 绪论

1.1 论文背景

1.2 研究现状

1.3 研究内容

1.4 论文结构

第二章 数据集成理论和技术

2.1 数据集成方案

2.2 ETL技术

2.2.1 数据抽取

2.2.2 数据转换

2.2.3 数据装载

2.3 主要数据集成工具

第三章 本体与规则引擎

3.1 本体概述

3.1.1 本体概念

3.1.2 本体的建模元语

3.1.3 本体的形式化表示

3.2 规则引擎

3.2.1 基于规则的专家系统

3.2.2 规则引擎规范和规则语言

3.3 本体与规则引擎的联系

第四章.数据集成框架和关键技术研究

4.1 基于知识库的数据集成框架

4.1.1 集成框架

4.1.2 知识库

4.2 本体语义库

4.3 规则库与规则管理

4.3.1 业务规则与规则管理系统

4.3.2 规则库设计

4.3.3 规则存储与规则引擎

4.3.4 规则管理

4.4 映射库与模式映射

4.4.1 映射库设计

4.4.2 模式映射

4.4.3 模式映射对知识库的影响

第五章.个人信息集成系统的设计与实现

5.1 系统的逻辑架构

5.1.1 系统包图

5.2 系统数据模型设计

5.3 数据规则的设计与实现

5.3.1 数据语法规则

5.3.2 数据编码规则

5.4 半自动化模式映射

5.5 数据装载的实现

第六章.总结与展望

6.1 论文工作总结

6.2 下一步工作方向

参考文献

致 谢

攻读学位期间发表的学术论文

展开▼

摘要

近几十年来,随着科学技术的迅猛发展和信息化的推进,人类社会所积累的数据量已经超过了过去5000年的总和,数据的采集、存储、处理和传播的数量也与日俱增。企业为了实现数据共享,减少资料收集、数据采集等重复劳动和相应费用,必须首先进行数据集成。企业异构数据集成技术是将企业分布的、异构的独立信息源中的有用数据集成在一起,使得用户能够以透明的方式访问这些数据源,以供信息检索、分析处理等应用的技术。
   现有的集成技术主要分为逻辑集成和物理集成两种方式,对于企业中的信息,因为强调从积累的数据中分析挖掘出有商业价值的信息,更适合用物理集成的方式。物理集成过程中最重要的技术是ETL(抽取、转换和装载)技术。当前已有的一些ETL产品主要基于图形化的作业配置形式,嵌入可执行的脚本,缺少灵活的“记忆”、“推荐”等智能支持。本文从本体和规则引擎入手,研究了一套基于知识库的智能的集成方案。
   论文提出了一种基于知识库的数据集成框架。此框架将数据集成与知识库、规则引擎等智能技术联系起来,突出了“知识”在集成过程中的作用。论文首先给出了基于知识库的集成框架结构,分析了框架的各组成部分和其作用。接着重点研究了知识库的设计,包括语义库、映射库和规则库。提出了一种基于规则库以及历史映射信息的新的模式映射算法,以求实现模式映射的自动化。分析了规则库和规则管理的相关技术,并给出了在数据集成框架中规则引擎、规则管理等规则相关问题的解决方案。最后论文按照设计的集成框架实现了个人信息集成系统,融入了其中的所有研究点,并实现了数据查询和可视化分析功能,取得了良好效果。
   与已有的数据集成工具相比,论文提出的集成框架的优势在于:引入了知识库,不断积累的知识为集成的智能化提供了基础;语义库消除了集成过程中的难以解决的语义冲突问题;模式映射的半自动化功能节省了时间和人力:提供了灵活的规则配置功能;提供了可视化分析功能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号