声明
目 录
1.绪 论
1.1 研究背景及意义
1.2 国内外研究现状
1.3主要工作及创新
2.血缘关系解析原理概述
2.1 数据仓库
2.1.1 Hadoop
2.1.2 HBase
2.1.3 ETL
2.1.4 Hive
2.1.5 Hive SQL
2.2 词法分析
2.2.1 有穷状态自动机
2.3 语法分析
2.3.1 上下文无关文法
2.3.2 LL文法与LR文法
3.词法解析技术
3.1 词法解析主要流程
3.2 过滤注释
3.3 词法切分
3.3.1 断词拼接功能
3.3.2 规范转义字符和引号
3.3.3 拼接关键字
3.3.4 非连续关键字的处理
3.3.5 括号的拼接与删除
3.4复杂语法的结构变换
3.4.1 嵌套查询
3.4.2 联合查询
3.5 本章小结
4.语法解析技术
4.1 存储器
4.2 宏观解析语法分析器
4.2.1 设计思路
4.2.2 宏观解析流程
4.3 生成类语法解析器
4.3.1 目标表信息获取
4.3.2 函数及关键字过滤解析器
4.3.3 目标表提取流程
4.3.4 源表提取解析
4.3.5 血缘关系提取解析
4.3.6 计算符解析器
4.3.7 括号嵌套解析器
4.3.8 血缘关系提取解析器
4.3.9 表名规范化功能
4.4删除类解析器
4.5 溯源功能
4.6 本章小结
5.应用测试及分析
5.1 开发测试环境
5.2 测试数据
5.3测试过程
5.4 测试结果
5.5 结果分析
6.总结与展望
6.1工作总结
6.2 未来工作的展望
参考文献
致 谢
西南财经大学;