首页> 中国专利> 一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法

一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法

摘要

本发明公开了一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法解决医疗保险中的挂床就医骗保行为问题。利用统计和机器学习相结合,可有效地刻画病人的住院行为,减少人工判别工作量。病人特征刻画从病人住院特征和病人基本个人信息进行刻画。挂床行为检测方法构建了挂床行为模型,由特征刻画-聚类分析-人工筛选-机器学习建立模型四个流程来构建模型。该挂床行为检测方法利用统计和机器学习相结合,有效的甄别挂床就医行为,对病人的住院行为进行特征刻画,有效地刻画病人,利用聚类的方法,筛选出离群点,聚类能够大量减少正常的数据,减少人工筛选阶段的工作量;在挂床行为模型建立后,利用此模型对病人的住院行为进行预测。

著录项

  • 公开/公告号CN105335618A

    专利类型发明专利

  • 公开/公告日2016-02-17

    原文格式PDF

  • 申请/专利权人 成都数联易康科技有限公司;

    申请/专利号CN201510758469.6

  • 发明设计人 付波;李民强;沈磊;张岩龙;邓军;

    申请日2015-11-10

  • 分类号G06F19/00(20110101);G06K9/62(20060101);G06F15/18(20060101);

  • 代理机构成都金英专利代理事务所(普通合伙);

  • 代理人袁英

  • 地址 611730 四川省成都市高新区(西区)合作路89号

  • 入库时间 2023-12-18 14:11:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-30

    授权

    授权

  • 2016-03-16

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20151110

    实质审查的生效

  • 2016-02-17

    公开

    公开

说明书

技术领域

本发明涉及一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法。

背景技术

随着社会经济的发展,国家为了给老百姓提供更好的医保环境,医保政策越来越好。然而总有一些人,通过一些虚假的就医行为来骗取医保,严重的损害了其他真正需要医保救治的人的权益。一般可以通过医保人员的就医数据来帮助社保机构来进一步检测出异常数据,但是医院每天产生大量的原始医保数据,如果仅通过人工手段来进行异常检测的话,不仅速度慢,浪费人力,且难保证准确度。再加上医院每天的数据都是动态增加,又加大人工处理的难度。

挂床又称“假住院”,通过挂床住院“病人”享受医保医疗报销,医院也可从中“套取”医保基金而“创收”。目前在“挂床”这种虚假就医行为的甄别的方面主要采取的是相对原始的方法,主要是工作人员在医院蹲点守候,例如当发现有病人在医院有住院的记录但是该病人实际上并没有在该医院进行住院治疗,就是“挂床”住院,就可以认定该病人是挂床。这种方法不但浪费人力财力,而且会起到事倍功半的效果。

利用聚类算法可以有效地筛选异常数据,将具有相似特征的病人聚集在一起,利用聚类算法可以大大的减少人工参与阶段的的工作量。但是一些常用的聚类算法,并不能起到较好的效果。例如:K-means算法K是事先给定的,这个K值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适;初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果;K-means算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。

在这里本发明提出了一种针对挂床行为的检测方法,利用统计技术和机器学习相结合,通过病人的住院特征画像、人工的参与确认、机器学习构建挂床就医模型,可以实现对挂床行为的有效甄别。通过此过程,能够显著的减少工作量,提高工作效率,并且在模型的不断优化的过程中,对挂床行为的检测的精确度也会越来越高。

发明内容

本发明的目的在于克服现有技术的不足,提供一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法,该挂床行为检测方法利用统计和机器学习相结合,对病人的住院行为进行特征画像、聚类、人工参与和机器学习,有效的甄别挂床就医行为,对病人的住院行为进行特征刻画,有效地刻画病人,利用聚类的方法,筛选出离群点,大量减少正常的数据,减少人工筛选阶段的工作量;在挂床行为模型建立后,利用此模型对病人的住院行为进行预测。

本发明的目的是通过以下技术方案来实现的:一种病人特征刻画方法,它包括病人住院特征刻画和病人基本个人信息刻画,所述的病人住院特征刻画从病人患病种数t1、住院次数t2、报销费用t3、是否有床位重叠t4、是否存在团体住院t5五个方面来进行刻画,病人住院特征表示为F1={t1,t2,t3,t4,t5},所述的病人基本个人信息刻画从病人的年龄s1、职业s2、文化程度s3、性别s4、收入s5和收入是否稳定s6来进行,病人基本个人信息表示为F2={s1,s2,s3,s4,s5,s6},病人特征画像G表示为G=F1||F2

所述的病人患病种数t1的异常度表示方式为

αt1-1-1公式1

其中t1代表患病种数,α代表病人在患病种数方面的异常程度的底数;

病人住院次数t2的异常程度表示为

(t2-1)*β公式2

其中t2代表病人患病次数,β代表病人在住院次数方面的异常程度的参数;

所述的报销费用t3异常度由病人实际报销费用t3和预计报销费用t3′的比值表示,比值越大,异常度越大;当有床位重叠表示存在挂床行为;

所述的是否存在团体住院的异常程度表示为

e=nη公式3

其中e代表病人在团体住院方面的异常程度,n代表与该病人有相交住院区间且相交天数大于阈值A的病人数,η代表病人在团体住院方面的异常程度的常数。

基于病人特征刻画方法的挂床行为监测方法,它包括如下步骤:

S1:特征刻画,根据病人住院特征和基本个人信息对病人特征进行刻画;

S2:病人特征聚类,利用聚类算法将离群的病人检测出来;

S3:病人特征人工筛选,将聚类检测出的离群的病人进行人工筛选;

S4:挂床行为模型建立,结合步骤S3标注出的异常数据和步骤S2确定的正常数据建立挂床行为模型;

S5:新住院信息检测,利用挂床模型筛选挂床就医的病人。

所述的病人特征聚类基于DBSCAN算法以半径和最小包含点数为参数来进行聚类。

所述的病人特征人工筛选通过人工参与进行确认,通过专业人员进行实地考察、追踪、走访或在医院蹲点守候的方式进行筛选确认,对挂床就医病人进行标注。

所述的挂床行为模型建立利用机器学习的算法构建挂床行为的模型,机器学习算法包括随机森林算法。

本发明的有益效果是:本发明提供了一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法,该挂床行为检测方法利用统计和机器学习相结合,对病人的住院行为进行特征画像、聚类、人工参与和机器学习,有效的甄别挂床就医行为,对病人的住院行为进行特征刻画,有效地刻画病人,利用聚类的方法,筛选出离群点,理论上可以对存在挂床就医行为的病人达到100%的召回率,聚类能够大量减少正常的数据,减少人工筛选阶段的工作量;在挂床行为模型建立后,利用此模型对病人的住院行为进行预测。

附图说明

图1为特征刻画示意图;

图2为挂床检测流程图;

图3为新住院信息检测流程图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。

如图1所示,一种病人特征刻画方法,它包括病人住院特征刻画和病人基本个人信息刻画,所述的病人住院特征刻画从病人患病种数t1、住院次数t2、报销费用t3、是否有床位重叠t4、是否存在团体住院t5五个方面来进行刻画,病人住院特征表示为F1={t1,t2,t3,t4,t5},所述的病人基本个人信息刻画从病人的年龄s1、职业s2、文化程度s3、性别s4、收入s5和收入是否稳定s6来进行,病人基本个人信息表示为F2={s1,s2,s3,s4,s5,s6},病人特征画像G表示为G=F1||F2

一个正常的病人所患的病种数只能是少数的,若是患的病种数超过一定的限度,该病人的可疑度是成指数型增长的。病人患病种数t1的异常度表示方式为

αt1-1-1公式1

其中t1代表患病种数,α代表病人在患病种数方面的异常程度的底数。当患有一种病时,病人的患病程度为0;当患两种病时病人的异常程度是α。底数α可以在多次试验后得到的一个较为合理的结果。

由病人的历史住院信息得到病人所换的病种数t1,并初始化每个病人的异常程度ω。

由病人的异常程度得到病人所在科室的异常程度E。主要利用公式:

E=s1sω公式4

S1代表该病人在该科室的住院次数,S代表病人总的住院次数,ω代表病人的异常程度。利用此公式依次处理每一个病人,得到该科室总的异常程度,为了消除每个科室住院人数的差异,本发明利用科室的平均异常程度代表科室的异常程度,利用公式:

Es2公式5

E代表科室总的异常程度,S2代表科室总的住院人数

利用该医院异常程度最大的科室的异常程度Emax代表该医院的异常程度H,因为若一个医院的科室有问题就有很大的可能说明这个医院有问题。最后会得到所有医院在病人所患病种数方面异常程度的排名,便于比较。

经过试验,可以得出:病人的患病种数t1是对病人的住院行为的一个很好的刻画。

一个正常的病人的住院次数不应该过高,若是一个病人的住院次数过高,该病人的异常程度是不断增长的。病人住院次数t2的异常程度表示为

(t2-1)*β公式2

其中t2代表病人患病次数,β代表病人在住院次数方面的异常程度的参数。当病人的住院次数为1次时,病人的异常程度位0,当病人的住院次数为2时,病人的异常程度为β。参数β是在多次试验后得到的一个结果。

所述的报销费用t3异常度由病人实际报销费用t3和预计报销费用t3′的比值表示,比值越大,异常度越大。以医院某一年的数据为例,有一条曲线对这一年的医院的收入进行拟合,若是实际的收入Z与预测收入在z’的差距过大,就说明该医院在这个月份存在一定的问题。再着重查看在该月该医院的科室,是否也是在该月份出现了较大的增长幅度,着重查看该科室的病人的一些其他的住院信息,例如是否是经常住院的病人,是否是患病种数很多的病人,该病人与其他的病人是否出现床位重叠的状况,最后利用这种方法也会获得一定数量的异常的病人,由人工进行参与筛选标注。

当有床位重叠表示存在挂床行为,若是同一张床位在同一时间住了多位病人,那么就可以得出该医院在这方面存在问题,有“挂床”住院的嫌疑。

从医院的角度考虑,“挂床”行为肯定不是单一病人的一种行为,肯定会有一批与医院建立合作的关系的病人,这样达到的效果会更好,相比一个偶尔挂床的病人,这部分病人更值得医院的信赖,病人和医院都能获得一定的利益。

考查病人的住院日期D,取最早的住院时间D1和最晚的住院时间D2作为病人住院日期的区间,对每一个病人做相同的处理,得到每个病人的住院区间。考查病人之间住院日期的有重合的这一部分病人,考查这部分病人在相同的住院期间的患病状况γ,住院次数δ,得病状况ε。查看这部分病人是否有可疑的病种∈(主要排除慢性病的情况),是否患相同的病θ,基于这种考查会得到一部分可疑的病人,再将这部分由人工参与筛查确认,并由此来进一步考查科室医院。

从上所述可以得到对待团体住院行为时,病人异常程度的表示方法:依次处理每个病人的住院日期(最早的住院时间D1和最晚的住院时间D2)并且存储病人的每条住院记录,得到每个病人的住院区间。选定一个病人,依次处理剩下的病人,若与该病人的住院区间相交并且在相交的时间段内,病人的单条住院记录相交天数大于一定阈值ɑ,则将病人的异常程度增加η(η为常数),以此得到每个病人在团体住院方面的异常程度e,e越大病人的异常程度越高。可得:

e=nη公式3

其中e代表病人在团体住院方面的异常程度,n代表与该病人有相交住院区间且相交天数大于阈值A的病人个数,η代表病人在团体住院方面的异常程度的常数。

如图2所示,基于病人特征刻画方法的挂床行为监测方法,它包括如下步骤:

S1:特征刻画,根据病人住院特征和基本个人信息对病人特征进行刻画;

S2:病人特征聚类,利用聚类算法将离群的病人检测出来;

S3:病人特征人工筛选,将聚类检测出的离群的病人进行人工筛选;

S4:挂床行为模型建立,结合步骤S3标注出的异常数据和步骤S2确定的正常数据建立挂床行为模型;

S5:新住院信息检测,利用挂床模型筛选挂床就医的病人。

所述的病人特征聚类基于DBSCAN算法以半径和最小包含点数为参数来进行聚类,,参数的不同会导致不同的召回率和准确率。半径和最小包含点数需要经过多次试验才可确定合适的值。DBSCAN算法,该算法对异常数据可以达到100%的召回率,但其准确率相对较低,但是相比于庞大的病人的住院记录,利用DBSCAN算法筛选出的离群点数据仅占原始数据的10%左右,在进行虚假就医行为的筛选时,极大地减少了工作量。

所述的病人特征人工筛选通过人工参与进行确认,通过专业人员进行实地考察、追踪、走访或在医院蹲点守候的方式进行筛选确认,对挂床就医病人进行标注。

所述的挂床行为模型建立利用机器学习的算法构建挂床行为的模型,机器学习算法包括随机森林算法。

如图3所示,一条病人住院信息到达之后,利用模型可直接对数据进行分类。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号