首页> 中文学位 >基于数据仓库的多维关联规则挖掘技术在税务稽查系统中的研究与应用
【6h】

基于数据仓库的多维关联规则挖掘技术在税务稽查系统中的研究与应用

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1研究背景及意义

1.2数据挖掘技术在国内外税收分析中的应用现状

1.3本文结构及解决的关键问题

第二章 现有各种多维数据模型及多维关联规则挖掘算法的分析与比较

2.1现有各种多维数据模型的分析与比较

2.1.1星形模型

2.1.2雪花形模型

2.1.3事实星座形模型

2.1.4小结

2.2现有各种多维关联规则挖掘算法的分析与比较

2.2.1 Apriori算法

2.2.2目前提高Apriori算法的效率主要有以下几种方式

2.2.3基于约束的关联挖掘

2.3本章小结

第三章 税务稽查数据模型的构建

3.1概念模型

3.2逻辑模型

3.3维表和事实表

3.4产生稽查数据立方

3.5本章小结

第四章 基于APRIORI算法的改进税务稽查关联规则挖掘算法

4.1元规则定义

4.2税务稽查元规则分析

4.3权重的定义

4.4基于权重的税务稽查关联规则挖掘算法

4.5改进算法的描述

4.6由频繁项集产生关联规则

4.7改进算法与现有APRIORI算法的比较

4.8产生关联规则

4.9本章小结

第五章 广东地税税收分析(含稽查)系统

5.1总体结构

5.2.1大集中生产系统

5.2.2数据复制平台

5.3 ETL

5.3.1抽取

5.3.2转换

5.3.3清洗

5.4物理实现

5.4.1数据仓库的存储容量估算

5.4.2系统配置估算

5.4.3多维分析服务器配置

5.4.4 BI展现平台服务器配置

5.5系统展示

5.6本章小结

结论

参考文献

致谢

展开▼

摘要

当前,数据挖掘研究发展十分迅速,税务系统的信息化建设也逐步走向数据管理阶段。但是,数据挖掘在税务系统的应用还处于起步阶段。因此,研究数据挖掘技术在税务系统的应用,具有重要的理论意义和现实价值。 本论文研究在现有税收数据的基础上,如何对不同行业、产品和市场中纳税人的特性和行为进行描述和分析,找出税收管理人员关心的相关规律。为此建立了多维税务稽查数据模型,并在此基础上进行了关联规则的挖掘。 关联规则是数据挖掘研究的一个重要分支,在生成的数以干计的关联规则中,用户感兴趣的只是一部分。本文根据当前关联规则挖掘算法存在无法获得高兴趣度的关联规则的问题,提出了基于Apriori算法的改进税务稽查关联规则挖掘算法。通过在挖掘算法中增加元规则、为每个属性设定权值,最终使挖掘结果聚焦于用户感兴趣的规则形式上。该算法不仅可以获得高兴趣度的关联规则,还基于划分的思想提高了算法的效率。 本论文重点分析了行业分类、注册类型、税种这三个属性之间的关系,得出了高兴趣度的关联规则。本文的理论研究和软件系统的实现为税务稽查人员开展相关工作其到了积极作用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号