首页> 中文学位 >数据挖掘方法在纳税人行为分析中的研究和实现
【6h】

数据挖掘方法在纳税人行为分析中的研究和实现

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究的目的和意义

1.2数据挖掘技术

1.3数据挖掘在税务部门应用现状

1.4课题的研究背景及存在问题

1.4.1研究概况

1.4.2研究过程中出现的问题

1.5研究内容及工作安排

第二章税收业务分析和数据挖掘工作流程

2.1税收管理模式

2.2税务行业信息化现状及发展趋势

2.3税收数据分析

2.3.1税收信息数据库特点

2.3.2纳税人属性分析

2.4数据挖掘在税收管理中的应用要求

2.5基于数据挖掘方法的纳税人行为分析工作流程

2.5.1纳税人特征数据提取

2.5.2税收数据处理

2.5.3知识挖掘

2.5.4结果发布利用

2.6本章小结

第三章关联规则分析方法在税务行业的实现

3.1引言

3.2关联规则

3.2.1关联规则的基本概念

3.2.2关联规则定义

3.2.3关联规则挖掘的步骤

3.2.4关联规则的主要种类

3.3 Apriori算法实现

3.3.1 Apriori算法原理

3.3.2 Apriori算法编程实现

3.3.3 Apriori算法挖掘布尔型关联规则实验

3.3.4基于Apriori算法挖掘数值型关联规则

3.4 FP_Tree算法

3.4.1 FP_Tree算法原理

3.4.2基于FP_Tree算法挖掘关联规则的实验

3.5关联规则在税收业务的应用

3.6本章小结

第四章决策树分类方法在税务行业的实现

4.1引言

4.2分类的分析方法

4.2.1分类的概念

4.2.2决策树分类方法

4.2.3 ID3算法的程序实现

4.2.4基于ID3算法构造纳税人流失分类模型的实验

4.3 SCP后剪枝方法的程序实现

4.3.1决策树构造的过度问题和解决方法

4.3.2 SCP后剪枝方法的概念和思路

4.3.3 SCP后剪枝方法的程序实现说明

4.3.4对完全生长决策树剪枝实验

4.4基于FP_Tree的ID3改进算法的程序实现

4.4.1决策树构造性能低下的问题和解决思路

4.4.2改进算法原理和优点分析

4.4.3改进算法的程序实现

4.4.4实验结果及分析

4.5分类模型在税收业务的应用

4.6本章小结

第五章总结与展望

5.1总结

5.2展望

致 谢

参考文献

作者在读期间的研究成果

展开▼

摘要

税务部门针对提高税收征管水平,加强数据资源开发利用的要求,尝试进行数据挖掘技术的研究和应用,探索基于较大规模税收数据而进行的纳税人行为分析和预测。本文研究并实现了关联规则发现和决策树分类等算法,并针对税收数据特点,优化了ID3等算法,分析纳税人欠税和纳税人流失的可能性。
   首先,本文就数据挖掘中关联规则的概念和作用进行了探讨,研究并实现了Apriori算法和FP Tree算法,通过真实的税收数据,挖掘出布尔型关联规则、数值型关联规则、多维关联规则等知识,通过实验和在税务部门的应用验证了算法程序的正确性和有效性。
   其次,本文介绍了决策树分类方法的概念,说明了经典ID3算法的原理和过程实现。针对税收数据的特点,实现了基于支持数和置信率的SCP后剪枝的方法和基于FP Tree的ID3改进算法,分别解决了决策树构造过度和构造效率低下的问题。通过实验证明了SCP的后剪枝方法和基于FP_Tree的ID3改进算法的有效性和优越性。利用改进算法构造的纳税人流失分类模型和纳税人欠税分类模型,应用到税收管理,提高了税收管理工作的质量和效率,取得了较好的社会效益和经济效益。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号