...
首页> 外文期刊>応用統計学 >小標本かつ応答変数発現確率が高い場合のロジスティック回帰モデルにおける回帰パラメータの検定法
【24h】

小標本かつ応答変数発現確率が高い場合のロジスティック回帰モデルにおける回帰パラメータの検定法

机译:样本少,响应变量出现概率高的逻辑回归模型中回归参数的检验方法

获取原文
获取原文并翻译 | 示例

摘要

When a logistic regression model is used under a small sample size and a high or a low event occurrence probability, it is important to confirm the existence of the complete or the quasi-complete separation. If the complete or the quasi-complete separation exists, a maximum likelihood estimator cannot be obtained. However, some statistical softwares such as SAS, S-PLUS or R execute an iteration method to obtain a maximum likelihood estimate. Commercial softwares present a result of the iteration with a warning message regarding the existence of the complete or the quasi-complete separation, or failing in convergence of the iteration. However, glm function implemented in R presents the result of the iteration with regard to the maximum likelihood estimate in spite of failing in convergence of the iteration. In this case, a standard error for the regression parameter estimate is very large. We show that it is possible to confirm the existence of the complete or the quasi-complete separation from the standard error for the regression parameter estimate. Firth (1993) suggested a method to eliminate a bias of the maximum likelihood estimator. As a result, Firth's method can estimate the regression parameter under the complete or the quasi-complete separation and it is possible to use Wald test using the standard error for the regression parameter estimate derived from Firth's method. However, Wald test using both the maximum likelihood method and Firth's method is very conservative under the small sample size and the high (or the low) event occurrence probability. The aim of this paper is to suggest a test for the regression parameter using the bootstrap method instead of Wald test under the small sample size and the high event occurrence probability that tends to near the complete or the quasi-complete separation. Under a null hypothesis, the probability of the type I error in the proposed method is compared with that in Wald test. We show that the proposed method for the slope parameter improves the type I error and assures the prescribed a significance level under the small sample size and the high event occurrence probability.%ロジスティック回帰モデルを小標本かつ応答変数発現確率が高い条件下ま たは低い条件下で用いる場合,完全分離または準完全分離が生じていないかを確認 することが重要である.完全分離または準完全分離が生じていると,最尤推定量は 存在しない.しかし,SAS,S-PLUSやRなどの統計ソフトウェアでは,最尤推定 値を求めるため,反復法を実行してしまう.SASやS-PLUSといった商用ソフト ウェアでは,完全分離または準完全分離の可能性や反復法が収束しなかったことを 警告表示した上で,反復法の結果を表示する.ところが,Rに標準で提供されてい るglm関数は,最尤推定値が求まっていか-にもかかわらず,そのことを明確に表 示せずに反復法の結果を表示してしまう.その場合,回帰パラメータ推定値の標準 誤差が大きくなるので,事後的にも標準誤差から完全分離または準完全分離を確認 できることを示した.Firth(1993)は,最尤推定量のバイアスを取り除く方法を提 案しており,結果として,完全分離または準完全分離が生じていても,回帰パラメー タの推定が可能となり,回帰パラメータ推定値の標準誤差を用いてWald検定が可 能である.しかし,最尤法またはFirth法によるWald検定は,小標本かつ応答変 数発現確率が高い(または低い)条件下で用いると,第一種過誤の確率が過度に保守 的となる.本論文では,完全分離または準完全分離に近い状態となりやすい,小標 本かつ応答変数発現確率が高い条件下において,回帰パラメータの検定をブートス トラップ法を用いて検定する方法を提案し,帰無仮説の下で第→種過誤の確率をシ ミュレーションによりWald検定と比較する.ブートストラップ法を用いた検定は, 小標本かつ応答変数発現確率が高い条件下で,保守的となる第一種過誤の確率を改 善し,回帰パラメータの検定に有用であることを示した.
机译:在小样本量和高或低事件发生概率下使用逻辑回归模型时,重要的是要确认是否存在完全分离或准完全分离。如果存在完全分离或准完全分离,则无法获得最大似然估计。但是,某些统计软件(例如SAS,S-PLUS或R)执行迭代方法以获得最大似然估计。商业软件向迭代结果显示警告消息,提示是否存在完全或准完全分离,或者迭代收敛失败。但是,尽管迭代收敛失败,但是在R中实现的glm函数仍会提供关于最大似然估计的迭代结果。在这种情况下,回归参数估计的标准误差非常大。我们表明,可以从回归参数估计的标准误差中确认是否存在完全分离或准完全分离。 Firth(1993)提出了一种消除最大似然估计器偏差的方法。结果,Firth的方法可以估计完全分离或准完全分离下的回归参数,并且可以将使用标准误差的Wald检验用于从Firth的方法得出的回归参数估计中。但是,在样本量较小且事件发生概率较高(或较低)的情况下,同时使用最大似然法和Firth方法的Wald检验非常保守。本文的目的是建议在小样本量和高事件发生概率(倾向于接近完全分离或准完全分离)的情况下,使用自举法而不是Wald检验对回归参数进行检验。在零假设的情况下,将所提出的方法中I型错误的可能性与Wald检验中的可能性进行了比较。我们证明了所提出的斜率参数方法可以改善I型误差,并在小样本量和高事件发生概率的情况下确保规定的显着性水平。%确证率が高い条件下完全分离または准完全分离が生じていると,最尤推定量は存在しない。や,SAS,S-PLUSやRなどの统计ソフトウェアでは,最尤推定値を求めるため,反复法を実行してしまう。SASやS-PLUSといった商用ソフトウェアト,完全分离または准完全分离の可能性や反复法が收束しなかったことを警告表示した上で,反复法の结果を表示する。ところが,Rに标准で提供されているglm关数は,最尤推定値が求まっていか-にも场合,场合,回帰パラメータ推定値の标准误差が大きくなるのそ,事后的にも标准误差から完全分离または准完全分离出生(1993年)は,最尤推定量のバイアスを取り除く方法を提案しており,结果として,完全分离または准完全分离が生じていても,回帰パラメータの推定が。しかし,最尤法またはFirth法によるWald検定は,小标本かつ応答変数発现确率が高い(または低い)条件下では用いると,第一种过错の确率が过度に保守的となる。の検定をブートストラップ法プ用いて検定する方法を实行し,帰无仮说の下で第→种过误の确率をシ検ーションによりWald検定と比较する。かつ応答変数発现确实率が高い条件下で,保守的となる第一种过误の确率を改善し,回帰パラメータの検定に有用であることを示した。

著录项

  • 来源
    《応用統計学 》 |2011年第1期| p.41-51| 共11页
  • 作者

    大倉征幸; 鎌倉稔成;

  • 作者单位

    〒112-8551東京都文京区春日1-13-27 中央大学大学院理工学研究科経営システム工学専攻;

    中央大学理工学部;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号