首页> 中文学位 >有限混合模型在慢乙肝相关疾病患者医疗费用研究中的应用
【6h】

有限混合模型在慢乙肝相关疾病患者医疗费用研究中的应用

代理获取

目录

声明

1 前言

1.1 慢乙肝相关疾病医疗费用研究的意义及统计方法应用现状

1.2 医疗费用的特殊分布及统计学问题

1.3 本研究目的和内容

1.4 本研究论文结构

2 有限混合模型原理与方法

2.1 有限混合模型原理

2.2 参数估计

2.3 模型拟合指标

2.4 确定分类

3 基于慢乙肝相关疾病医疗费用的模拟研究

3.1 实例数据来源

3.2 有限混合模型用于医疗费用数据的适用性研究

3.3 有限混合模型识别异质性能力及不同参数下分类效果模拟研究

4 讨论

4.1 有限混合模型用于医疗费用数据的适用性研究

4.2 有限混合模型识别异质性能力及不同参数下分类效果研究

4.3 创新点与局限性

5 结论

参考文献

综述:慢乙肝相关疾病医疗费用计量经济学方法研究

攻读硕士学位期间发表论文

致谢

展开▼

摘要

目的:目前,我国医疗费用快速增长,占GDP的比重不断升高。降低医疗费用、优化资源配置是政府医疗改革医疗保险重点解决的问题之一,因此精准地评价和预测医疗费用是制定医改方案和策略的重要前提。医疗费用的分布极其特殊,多数个体费用低于平均水平,少数个体费用极高,表现为极度正偏峰和厚尾特征。医疗费用的特殊分布提示患者群体存在严重的异质性,如假设医疗费用的分布来自多个分布的混合可为精准估计医疗费用提供一个新思路。有限混合模型(Finite mixture model,FMM)基于回归分析和聚类分析思想,将初始分布假设为不同分布的混合,用于识别群体间的异质性。本文介绍有限混合模型原理,基于慢乙肝相关疾病患者的真实医疗费用数据分布进行模拟研究和实证分析,评估FMM在慢乙肝相关疾病患者医疗费用研究中的适用性,进一步评价FMM识别异质性的能力以及在不同参数条件下的分类效果,为更精准的评价和预测医疗费用提供方法学支持和模型选择,为高费用患者监测和干预提供方法建议。
  方法:
  第一部分,基于广州市第八人民医院2012年门诊慢乙肝患者104646人次门诊总费用作为“全样本”进行Quasi-Monte Carlo实验,采用简单随机抽样方法,分别抽取样本量为500、1000、2000、5000、8000,10000、20000的样本。每种样本量重复50次的实验。对抽取的医疗费用样本分别拟合Lognormal、Gamma、Weibull分布的广义线性模型、2个成分有限混合模型和3个成分有限混合模型,进而评价各模型的精确度、偏倚和拟合优度。在广州市第八人民医院2012年门诊慢乙肝患者门诊费用中应用最优模型进行全样本分析,并在2015年慢乙肝患者门诊费用中进行外部样本验证。
  第二部分,基于上述模拟结果及广州市第八人民医院2008-2012年门诊肝硬化患者住院费用实例分析结果,选取Gamma分布、Weibull分布作为理论分布,使用Monte Carlo模拟方法,分别抽取2成分和3成分的样本进行混合,调整成分参数以及混合比例,设置样本量总计为1000、5000、10000的混合样本,每种模型每个样本量下重复50次的模拟实验。对模拟实验分别拟合各自理论分布的有限混合模型和广义线性模型,评价各种参数条件下个模型的成分数和绝对预测误差。
  结果:Quasi-Monte Carlo实验显示对于广州市第八人民医院2012年门诊慢乙肝患者医疗费用数据,从精确度上和拟合度上看,指定Weibull分布的3成分有限混合模型占优势,从总体预测上看,广义线性模型占优势。全样本验证显示了相同结果。外部样本分析结果显示指定Weibull分布的2成分有限混合模型为最优模型,精确度与拟合优度均高于广义线性模型。
  Monte Carlo模拟实验显示指定Weibull分布的2成分有限混合模型分类效果研究模拟实验中,FMM在各个参数各个比例下识别性能高。指定Weibull分布的3成分有限混合模型分类效果研究模拟实验中,当高费用成分与其他成分差异大时,FMM识别能力强。当高费用成分与其他成分差异减少时,FMM倾向于识别为2个成分。当中等成分费用和高费用成分厚尾部分重叠较多时,FMM倾向于识别为2个成分。当3个成分呈明显的3个单峰分布时,FMM倾向于识别为3个成分。两种比例下,FMM表现相似。指定Gamma分布的2成分有限混合模型分类效果研究模拟实验中,当成分1和成分2部分重叠时,高费用成分混合比例高时,FMM倾向于识别为3个成分,高费用成分混合比例较低时,FMM倾向于识别为2个成分。当2成分的差异明显(期望值、方差相差大)时,各种比例下,FMM倾向于识别为2个成分。指定Gamma分布的3成分有限混合模型分类效果研究模拟实验中,当成分3与成分2重叠部分增加时,在高费用成分混合比例较低的情况下,FMM倾向于识别为2个成分,在混合比例一致时,FMM倾向于识别为3个成分。当成分2和成分3同时右移时,3成分间的差异增加,3成分呈交叉远离的3单峰分布,高费用比例小时,FMM倾向于识别为3个成分数,当混合比例一致时,FMM倾向于识别为大于3的成分数。样本量越大,模型表现越好。FMM的精确度高于广义线性模型。
  结论:有限混合模型能够将人群识别为不同成分从而识别出医疗费用中的异质性,模型为解决医疗费用数据偏峰、厚尾分布特征提供了一个模型选择。FMM在个人预测上有优势。Weibull分布能够更好地拟合厚尾分布数据;2成分下FMM的表现优于3成分;数据差异大小,混合比例影响模型的识别性能;样本量越大,模型表现越好。本研究表明了FMM在医疗费用研究中的适用性和可行性。FMM模型能够进一步探究亚人群特征以及影响因素,为制定特定医疗保险策略,高费用患者监测和干预提供借鉴。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号