摘要:GEE是常见的边际模型估计方法。但只有当观测数据是完全随机缺失时,普通GEE才能得到一致无偏的估计结果;当观测值为单调随机缺失时,则需使用IPWGEE。IPW GEE利用个体在每一观测时刻缺失的条件概率,对观测值加权后进行估计,得到一致无偏估计结果。不同的缺失条件概率,会得到不同的权重,从而IPW GEE的估计结果也不同。个体缺失概率的估计可以运用Logistic 模型和log-log模型。这两个模型都是常见的分析二分类因变量和影响因素之间关系的模型,但在对同一数据进行分析时,两者预测的缺失概率并不完全相同。两者的连接函数都为S形,但前者的连接函数关于折点对称,个体缺失概率的增长速度在折点前后较一致,变化较小;而后者的连接函数关于折点不对称,个体缺失概率的增长速度,随着缺失概率的增大而增大,尤其是达到折点以后。因此,当个体缺失概率的增长速度突然增大,即样本缺失比例的突然大幅度提高,更适应于使用log-log模型。但只有当个体的缺失概率达到0.2以上时,即当样本缺失比例达到一定规模时,两个函数的缺失概率才有较明显的欧别。rn 本文通过分层抽样,模拟不同缺失比例的单调随机缺失,并分别采用两个模型进行估计,比较所得权重和IPW GEE的估计结果。但由于完成实验的个体比例至少需达到50%,因此在每一次观测时,发生缺失的个体比例均较小,此时个体的缺失概率较小,两个模型的预测缺失概率差异较小,IPW GEE的估计结果基本一致。