文摘
英文文摘
第一章 绪论
1.1 问题的提出
1.2 数据仓库系统
1.2.1 数据仓库系统结构
1.2.2 数据仓库的数据源
1.2.3 实时数据仓库系统
1.3 ETL应用背景
1.4 数据访问控制
1.5 本文研究的问题
1.6 本文的组织结构
第二章 数据仓库系统结构和关键问题
2.1 多类型数据源
2.2 数据仓库需求
2.3 面向多类型数据源的数据仓库体系结构
2.3.1 数据源层
2.3.2 抽取层
2.3.3 归档层
2.3.4 汇总层
2.3.5 仓库层
2.3.6 应用层
2.4 关键研究问题
2.4.1 Web数据的采集和存储
2.4.2 文本数据的关系化
2.4.3 数据库数据源ETL方法的改进
2.4.4 全局ETL的实时调度
2.4.5 数据仓库访问控制
2.4.6 其它关键问题
2.5 本章小结
第三章 基于PAGE BLOCK的WEB数据采集和存储
3.1 问题的提出
3.2 研究背景
3.3 基于Block的页面采集
3.3.1 页面分区算法
3.3.2 主题生成算法
3.3.3 页面比较算法
3.3.4 增量存储算法
3.3.5 采集和存储流程
3.4 原型系统的实现和测试
3.4.1 原型系统结构
3.4.2 算法评估
3.4.3 系统测试
3.5 相关工作
3.6 本章小结
第四章 基于模型映射的科学文本数据关系化
4.1 问题的提出
4.2 研究背景
4.3 数据模型
4.3.1 文本模型
4.3.2 对象模型
4.3.3 关系模型
4.4 映射机制
4.4.1 对象-文本映射
4.4.2 对象-关系映射
4.4.3 映射双向工程
4.5 缓存和安全性机制
4.5.1 缓存机制
4.5.2 安全机制
4.6 模型评估
4.6.1 效率评估
4.6.2 应用评估
4.7 相关工作
4.8 本章小结
第五章 基于分布式数据库的ETL方法和元数据驱动的ETL实现
5.1 问题的提出
5.2 研究背景
5.2.1 传统ETL方法
5.2.2 ETL工具
5.3 ETL方法改进
5.3.1 E-LT方法
5.3.2 E-LT方法的优点
5.3.3 基于SQL的E-LT实现
5.4 元数据驱动的ETL方法
5.4.1 ETL过程中的元数据
5.4.2 元数据驱动的ETL
5.4.3 E-LT工具实现
5.5 ETL性能分析
5.5.1 实验数据分析
5.5.2 案例数据分析
5.6 相关工作
5.7 本章小结
第六章 基于集成规则的实时ETL调度和离线框架实现
6.1 问题的提出
6.2 基于集成规则调度算法
6.2.1 理论依据
6.2.2 规则定义
6.2.3 调度算法
6.3 支持离线的客户端软件框架
6.3.1 相关定义
6.3.2 面向数据的构件框架
6.3.3 面向操作的构件框架
6.3.4 面向服务的构件框架
6.4 构件框架的实现
6.4.1 请求处理构件
6.4.2 操作缓存构件
6.4.3 操作同步构件
6.4.4 依赖处理构件
6.4.5 构件问协作
6.5 性能分析
6.5.1 并行性能分析
6.5.2 调度性能测试
6.6 案例分析
6.7 相关工作
6.8 本章小结
第七章 基于角色和意图的数据访问控制模型
7.1 问题的提出
7.2 引例
7.3 C-RBAC模型和UML建模
7.3.1 模型定义
7.3.2 访问授权和验证机制
7.4 基于意图的访问控制
7.4.1 模型定义
7.4.2 授权和验证
7.5 意图层次树挖掘
7.6 原型系统实现与分析
7.6.1 原型系统的实现
7.6.2 C-RBAC性能分析
7.6.3 PBAC性能分析
7.7 相关工作
7.8 本章小结
第八章 数据仓库系统实现和应用案例分析
8.1 数据仓库系统实现
8.2 应用案例分析
8.3 本章小结
第九章 总结和展望
9.1 本文的主要贡献
9.2 研究扩展
9.3 下一步工作
参考文献
致谢
攻博期间发表的论文
攻博期间参加的项目
作者简介