基于Hadoop平台的医疗保险欺诈检测的研究与应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着我国医疗与经济水平的进一步提高，我国医疗保险覆盖面已非常广，老百姓享受到了医保政策带来的真切好处。与之相对的，医保基金滥用的情况也有愈演愈烈的趋势，越来越多的基金被套取，打击非法欺诈行为势在必行。目前，医保经办机构主要利用规则系统对结算信息进行审核，规则依赖于少数指标，由于规则的不完善性与更新的滞后性使得相对不变的规则很容易被精心伪造的数据欺骗，利用计算机技术辅助审查迫在眉睫。
　　本文分析医保数据特点，使用数据挖掘技术建立了一套欺诈检测的流程，并结合业务系统，实现了医保大数据欺诈检测与审核，主要内容如下：
　　1.原始数据的特征工程处理。由于历史原因，现有数据集存在诸多瑕疵，首先对原始数据利用特征工程进行了处理，包括清除噪声数据，补全缺失值，结合实际业务流程提取特征等步骤。
　　2.基于DBSCAN的粗粒度欺诈筛查。根据数据极度不平衡的特点，研究无监督算法在欺诈检测中的应用，主要对比了各种聚类算法对数据集应用的效果，并结合标签信息拟定了使用DBSCAN算法识别异常群簇。
　　3.基于密度抽样与随机森林的精准欺诈检测。在聚类划分异常群体的基础上，提出一种基于密度的抽样方法对数据进行再平衡，并在随机森林算法中利用抽样信息对子分类器进行选择集成，分类与聚类算法的结合使用使得准确性大幅提高，最终形成完整的欺诈检测框架。
　　4.基于Hadoop平台的并行化实现。针对大规模数据的场景提出了DBSCAN与随机森林的并行化算法，并在Hadoop平台上使用Map-Reduce进行了实现，完成了一个欺诈检测与审核系统。
　　本文将数据挖掘技术应用到医保异常检测领域，其创新之处在于不再局限于针对特定欺诈场景进行建模，使得其能识别出一些较为罕见的数据，具有更强的泛用性；以局部密度为纽带，提出了一种基于密度的抽样方法，将DBSCAN算法与随机森林算法结合使用，在保证高准确率的同时有效地控制了过拟合；在实现并行化算法的同时提出了一种高维数据的划分方法，体现了负载均衡的思想。

著录项

作者
陈华杰;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名傅彦;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类保险组织;
关键词
聚类划分; 随机森林算法; 医疗保险; 数据挖掘; 异常检测; Hadooop平台;

相似文献

中文文献
外文文献
专利

1. 基于TLSTM的医疗保险欺诈检测 [J] . 曹鲁慧 ,秦丰林 ,闫中敏 . 计算机工程与应用 . 2020,第021期
2. 社会医疗保险欺诈行为实证研究——基于成本-收益的视角 [J] . 李连友 ,李亮 . 湖南师范大学社会科学学报 . 2011,第001期
3. 基于成本—收益理论的社会医疗保险欺诈问题研究 [J] . 李连友 ,李亮 . 财经理论与实践 . 2010,第1期
4. 基于Hadoop平台的文本相似度检测系统的研究 [J] . 王小林 ,肖慧 ,邰伟鹏 . 计算机技术与发展 . 2015,第008期
5. 基于Hadoop平台的XML文档重复数据检测 [J] . 李振兴 ,刘波 . 计算机系统应用 . 2013,第011期
6. 基于非均衡数据分类的保险欺诈检测研究 [C] . WANG Gang ,王刚 ,YANG Shanlin . 信息系统协会中国分会第四届学术年会 . 2011
7. 医疗保险欺诈检测的研究与应用 [A] . 郭涛 . 2016

基于Hadoop平台的医疗保险欺诈检测的研究与应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅