首页> 中文学位 >汽车保险欺诈索赔的关联分析
【6h】

汽车保险欺诈索赔的关联分析

代理获取

目录

声明

第一章 引言

1.1 研究的背景

1.2 研究的意义

1.3 研究内容及主要工作

第二章 文献综述

2.1 保险欺诈研究

2.2 关联分析的应用

第三章 关联分析

3.1 关联分析介绍

3.2 相关名词解释

3.3 关联规则算法

3.4 Apriori算法

3.4.1 算法基本介绍

3.4.2 算法实现伪代码

3.4.3 Apriori 算法优缺点

3.5 FP-growth 算法

3.5.1 算法基本介绍

3.5.2 算法实现过程

3.5.3 FP-growth算法优缺点

第四章 车险欺诈关联分析

4.1 数据来源及数据处理

4.2 欺诈和非欺诈模式区别

4.2.1 欺诈样本频繁项集

4.2.2 非欺诈样本频繁项集

4.3 挖掘关联规则

4.4 欺诈识别

第五章 灰色样本欺诈率估计

5.1 预测

5.2 灰色样本欺诈率估计

第六章 结论与展望

6.1 主要结论

6.2 展望

参考文献

致谢

展开▼

摘要

保险欺诈是保险行业中普遍存在的现象。在众多险种中,汽车保险是保险欺诈的高发区之一。目前,随着保险市场的普及以及人们生活水平的提高,国内汽车保有量逐年增加,车险业务快速发展;同时由于国内保险制度的不完善和保险欺诈管理实践的相对滞后,车险欺诈问题也日益突出,成为困扰保险业健康发展的巨大障碍。在这种背景下,车险欺诈识别就成为一个十分重要的话题。  本文在现有研究的基础上,将国内某大型保险公司2016年度的58429例车险理赔样本分为三类,即黑色样本(确认欺诈索赔类)、白色样本(确认诚实索赔类)及灰色样本(无法区分的索赔类);然后利用Apriori算法、FP-growth算法对黑色样本集进行关联分析,并将挖掘出的13个频繁项集在白色样本集中验证,结果全部有效,最后得到项集之间的关联规则。结果表明,在每个1-频繁项集下,都存在显著的关联规则;用其结果对灰色样本中的欺诈索赔进行识别,当{20,22}出现时,可以识别的欺诈有8498个,占灰色样本的34.26%;当{10,19,20}出现时,可以识别的欺诈有6325个,占灰色样本的25.50%;而当{19,20,5}出现时,可识别的欺诈有3621个,占灰色样本的14.60%。再将有显著区分度的频繁项集应用于灰色样本集,以预测灰色样本集的欺诈率。由于支持度越高得到的结果越可信,因此论文将频繁项集的支持度及区分度分别取为0.80和0.95,这时灰色样本集的欺诈率预测结果为0.4598,而全部理赔样本中的欺诈率为0.3752。这一结果与现有研究的欺诈率估计值较为接近。  由于保险欺诈识别方面的研究十分缺乏,利用数据挖掘技术对这一问题进行研究也刚刚开始,因此本论文的工作尚属探索性研究,其结论有待于进一步验证。但可以肯定的是,利用关联分析寻找欺诈行为特征,进而对欺诈索赔进行识别,将是保险欺诈学术研究与管理实践的重要方向之一。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号