首页> 中文学位 >基于数据挖掘的企业欠税预测研究
【6h】

基于数据挖掘的企业欠税预测研究

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪 论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 本文主要工作

1.4 本文组织结构

2 税收分析相关研究

2.1 税收分析概念

2.2 数据挖掘中的分类算法

2.3 数据仓库在数据挖掘中的应用

2.4 本章小结

3 税收数据数据仓库设计

3.1 税收数据概述

3.2税收数据过滤

3.3 数据仓库的建立

3.4 多维税务分析

3.5企业关联网络分析

3.6本章小结

4 税源企业欠税预测模型

4.1 税源欠税预测概述

4.2 基于分类的欠税预测模型

4.3 本章小结

5 实验与性能评估

5.1 实验设计

5.2 实验结果及分析

5.3 本章小结

6 总结与展望

6.1 本文工作总结

6.2 未来工作展望

致谢

参考文献

附录

A. 作者在攻读硕士学位期间发表的论文目录

B. 分类预测模型特征构建举例

展开▼

摘要

随着数据挖掘技术的广泛应用,通过数据挖掘等方法发现隐藏在大量业务数据背后的知识,将这些知识应用于决策支撑、商品营销等多个场景,可以为政府工作带来很多便利、为企业带来更多营收。利用数据挖掘技术针对税务数据进行企业欠税预测研究可以保障国家税收收入,同时为税务稽查部门带来很多便利。
  本文以某省地税局提供的税额征收记录以及企业注册信息为基础开展税源欠税研究,首先分析了税务记录的数据特点,如各字段的含义以及字段之间的关联,并据此制定了对应的过滤策略。为研究企业纳税行为与宏观经济及所在地区的关系,本文基于征收记录以及税务部门提供的数据字典建立事实表和维度表,从而建立数据仓库进行多维主题分析。通过多维主题分析发现,企业纳税税额及欠税行为与行业发展、所在地区存在一定的时间关联性,因此本文统计企业的税务数据包括每个企业每月的缴税数据、企业所在行业每月的缴税数据、企业所在区域每月的缴税数据作为判断企业是否欠税的一类决策特征,同时建立基于投资人、法人等关联人的企业网络,统计企业所关联企业每月的缴税情况作为描述企业营收情况的一类特征。
  为保障国家税收收入,本文根据企业之前一段时间的缴税信息预测下一个月企业是否欠税开展企业欠税的预测研究,采用基于数据挖掘的分类预测思想,通过统计观测时间窗口内的企业缴税信息、企业所在行业以及地域的缴税信息、企业关联企业的缴税信息作为特征,选择分类算法生成分类预测模型,预测下一个月是否会发生欠税行为。
  本文通过选择不同的实验数据集、属性筛选前后、设置不同的观测时间窗口数以及选择不同的分类算法对本文的分类预测模型的性能进行对比实验。实验结果表明:基于决策树的Random Forest分类算法的性能最优,分类模型的准确率、召回率、F值均可高达90%,企业欠税是可以通过企业之前一段时间的缴税情况以及所在行业、区域的缴税情况进行预测的,本文所提出的特征构建方法具有较强的适应性。

著录项

  • 作者

    时待吾;

  • 作者单位

    重庆大学;

  • 授予单位 重庆大学;
  • 学科 计算机系统结构
  • 授予学位 硕士
  • 导师姓名 钟将;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    分类预测; 数据挖掘; 企业欠税; 预测模型;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号