首页> 中文学位 >基于关联规则与孤立点的信息舞弊特征识别研究
【6h】

基于关联规则与孤立点的信息舞弊特征识别研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 选题背景及意义

1.2 国内外研究动态

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 创新点

1.4 本文组织结构

第2章 信息舞弊特征识别中使用的相关理论

2.1 数据挖掘

2.1.1 数据挖掘概述

2.1.2 数据挖掘的过程

2.2 关联规则分析

2.2.1 关联规则分析概述

2.2.2 经典Apriori算法

2.2.3 Apriori改进算法

2.3 孤立点分析

2.3.1 孤立点概述

2.3.2 基于距离的孤立点检测

2.3.3 基于聚类的孤立点检测

2.3.4 基于聚类和距离的改进孤立点检测

2.4 本章小结

第3章 关联规则在信息舞弊特征识别中的应用

3.1 关联规则与信息舞弊特征识别

3.2 案例背景与应用模型

3.2.1 案例背景

3.2.2 舞弊特征识别应用模型

3.3 样本选择和数据采集

3.4 数据准备

3.4.1 数据整合和筛选

3.4.2 数据清洗

3.4.3 数据预处理

3.5 关联规则挖掘与应用分析

3.6 评估及部署

3.7 本章小结

第4章 孤立点在信息舞弊特征识别中的应用

4.1 孤立点与信息舞弊特征识别

4.2 我国城镇职工医疗保险现状

4.3 案例背景与应用模型

4.3.1 案例背景

4.3.2 舞弊特征识别应用模型

4.4 数据采集与选择

4.4.1 数据采集

4.4.2 数据选择

4.5 数据准备

4.5.1 数据清洗

4.5.2 数据预处理

4.6 孤立点检测与分析

4.7 本章小结

第5章 总结与展望

5.1 本文工作总结

5.2 未来工作展望

参考文献

攻读硕士学位期间发表的论文及其它成果

致谢

附录1 程序代码

展开▼

摘要

信息化环境下,计算机及其相关技术的发展为企业经营管理带来了巨大收益的同时也为一些不法企业或者个人提供了更加丰富的舞弊手段。一方面信息化环境下新的舞弊手段的产生使得传统舞弊识别方法已经不再适用;另一方面信息化环境下积聚了海量业务数据,如何充分利用海量数据背后有价值的信息,为识别舞弊信息提供依据,已经成为当前科研人员的一项重要任务。数据挖掘作为一种可以从海量数据中提取隐含的预测性信息的新技术,研究数据挖掘在信息舞弊识别领域的应用,挖掘海量数据中隐含的舞弊特征,为提取舞弊信息提供参考具有重要的理论和现实意义。
   本文根据数据挖掘中的关联规则理论和Apriori算法,以固定资产投资项目专项审计为背景,采集相关样本数据,利用IBM SPSS Modeler14.2完成数据的选择、清洗、预处理等一系列数据准备工作,最后用Apriori算法挖掘数据集中潜在的、有价值的、有联系的规律,并以此来指导舞弊信息的识别,分析舞弊信息的特征,为降低审计风险,提高审计效率提供支撑,并可以形成规则库为今后审计提供思路。
   另外,本文结合基于距离和基于聚类的孤立点检测算法的特点,介绍了一种更加高效的改进算法并将其引入信息舞弊识别领域,以城镇职工医疗保险舞弊识别为背景,通过数据库SQL语句完成数据准备的相关工作,结合数据特点和实际情况分段进行孤立点检测,对孤立点进行跟踪审计,最后分析舞弊信息的特征,为日后锁定审计重点提供指导。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号