首页> 中文学位 >基于数据挖掘技术的税务数据仓库应用平台建设
【6h】

基于数据挖掘技术的税务数据仓库应用平台建设

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究意义

1.2 国内外研究现状分析

1.2.1 国外税务系统应用概述

1.2.2 国内税务信息数据应用现状及前景

1.3 面临的困难

1.4 课题研究的目标

1.5 论文的结构安排

第2章 相关理论基础

2.1 数据仓库

2.1.1 数据仓库的定义与特征

2.1.2 数据仓库的体系结构

2.1.3 数据仓库的模型设计

2.1.4 数据仓库的设计方法与步骤

2.2 OLAP

2.2.1 OLAP的特点

2.2.2 OLAP多维概念和多维操作

2.2.3 OLAP技术中数据存储方式

2.3 数据挖掘

2.3.1 数据挖掘概念

2.3.2 数据挖掘的基本步骤

2.3.2 数据挖掘和OLAP

2.3.4 数据挖掘任务

第3章 数据挖掘之聚类分析

3.1 聚类分析

3.1.1 聚类的典型要求

3.1.2 聚类算法相似性度量

3.2 K-MEANS算法及算法演示

3.2.1 K-均值算法

3.2.2 K-MEANs算法标量规格化

3.2.3 K-MEANS算法计算过程

第4章 宁波地税数据仓库设计

4.1 系统的需求分析

4.1.1 税收决策分析需求

4.1.2 重点税源

4.2 项目总体目标分析

4.3 税务数据仓库的构建

4.3.1 概念模型设计

4.3.2 逻辑模型设计

4.3.3 事实表与维度表的设计

4.4 税务数据仓库生成

4.4.1 总体设计

4.4.2 ETL元数据设计

4.4.3 ETL流程设计

4.4.4 ETL调度设计

第5章 宁波地税数据仓库平台实现

5.1 总体应用架构

5.2 OLAP实现

5.2.1 税收分析主题模型建立

5.2.2 FrameworkManage打包发布

5.2.3 展示业务主题

5.3 聚类分析K-MEANS算法在税务平台的应用

5.3.1 税源管理的数据挖掘

5.3.2 数据选择

5.3.3 数据抽取

5.3.4 目标数据库的建立

5.3.5 聚类分析的实施

第6章 结论与展望

6.1 结论

6.2 展望

参考文献

致谢

展开▼

摘要

近年来,国家税务总局越来越强调税务数据的综合利用,已经把各个分局的税收数据下发到各分局的数据服务器,让各分局自己根据需要,利用这些税务数据,进行查询分析和信息的挖掘。充分的利用这些税务数据,对税收业务是一项有重要意义的事务。
   随着税务信息技术的发展,税收数据的存储量越来越大,但是凭借人的肉眼观察和一般的分析工具难以发现隐含在税收数据中的某些有价值的信息。数据仓库技术是近年来兴起的一项信息技术,知识模式挖掘技术,它可以从大量的数据中挖掘隐含在其中的有价值的信息。尝试把数据挖掘应用到税收数据利用,应该是一件有意义的事务。这也涉及到数据仓库的建设、数据挖掘的技术和原理,数据挖掘工具的选择。
   本文根据国家税务总局关于税务数据应用的要求结合宁波地方税务局的实际情况,从税务数据应用平台建设出发,在分析税务信息化现状基础上,全面介绍了数据仓库概念及关键技术,数据挖掘的概念、算法、作用,研究了如何对数据仓库的逻辑模型与物理模型进行设计,进而构建了税务系统的数据仓库并在此基础应用cognos10对税收分析主题的OLAP多维数据立方体进行了展示。着重分析了聚类方法及其经典算法K-Means算法,实现了税源群体的合理分类,对不同类别税源实施不同的管理措施,对重点税源与优质税源进行重点监控,保证征管力量的合理分配,实现税源管理的科学化与精细化。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号