声明
摘要
第1章 绪论
1.1 研究意义
1.2 国内外研究现状分析
1.2.1 国外税务系统应用概述
1.2.2 国内税务信息数据应用现状及前景
1.3 面临的困难
1.4 课题研究的目标
1.5 论文的结构安排
第2章 相关理论基础
2.1 数据仓库
2.1.1 数据仓库的定义与特征
2.1.2 数据仓库的体系结构
2.1.3 数据仓库的模型设计
2.1.4 数据仓库的设计方法与步骤
2.2 OLAP
2.2.1 OLAP的特点
2.2.2 OLAP多维概念和多维操作
2.2.3 OLAP技术中数据存储方式
2.3 数据挖掘
2.3.1 数据挖掘概念
2.3.2 数据挖掘的基本步骤
2.3.2 数据挖掘和OLAP
2.3.4 数据挖掘任务
第3章 数据挖掘之聚类分析
3.1 聚类分析
3.1.1 聚类的典型要求
3.1.2 聚类算法相似性度量
3.2 K-MEANS算法及算法演示
3.2.1 K-均值算法
3.2.2 K-MEANs算法标量规格化
3.2.3 K-MEANS算法计算过程
第4章 宁波地税数据仓库设计
4.1 系统的需求分析
4.1.1 税收决策分析需求
4.1.2 重点税源
4.2 项目总体目标分析
4.3 税务数据仓库的构建
4.3.1 概念模型设计
4.3.2 逻辑模型设计
4.3.3 事实表与维度表的设计
4.4 税务数据仓库生成
4.4.1 总体设计
4.4.2 ETL元数据设计
4.4.3 ETL流程设计
4.4.4 ETL调度设计
第5章 宁波地税数据仓库平台实现
5.1 总体应用架构
5.2 OLAP实现
5.2.1 税收分析主题模型建立
5.2.2 FrameworkManage打包发布
5.2.3 展示业务主题
5.3 聚类分析K-MEANS算法在税务平台的应用
5.3.1 税源管理的数据挖掘
5.3.2 数据选择
5.3.3 数据抽取
5.3.4 目标数据库的建立
5.3.5 聚类分析的实施
第6章 结论与展望
6.1 结论
6.2 展望
参考文献
致谢