首页> 外文期刊>電子情報通信学会技術研究報告 >生存時間研究における調整型ランダムフォーレスト法
【24h】

生存時間研究における調整型ランダムフォーレスト法

机译:生存研究中的调整随机森林法

获取原文
获取原文并翻译 | 示例
       

摘要

決定木を基本学習器として用いたアンサンブル学習法のなかで,とくにRandom Forest法は,有用性が広範に用いられている方法の一つである.他方,癌臨床研究の有効性の統計的評価に用いられる生存時間解析の分野において,アンサンブル学習法の研究はあまり行われていない.本報告では,生存時間研究におけるRandomForest法の有効性を検討した.さらに,予測確度の向上を意図して,個々の基本学習器を縮小回帰推定に基づいて調整する,調整型生存時間RandomForest法を提案した.調整型生存時間RandomForest法の性能は,文献事例により検討した.その結果,既存の生存時間RandomForest法に比べて良好な結果を示した.%One of the important themes in survival analysis is to explore prognoses factors that influence survival time. Recently, the tree-structured method has been applied to evaluate covariates (e.g., Crowley, 2004); however, it is well known that this method has provides poor prediction model. This problem could be improved by modeling many trees in a linear combination, namely, ensemble learning. The ensemble learning method is actively studied in machine learning and statistics. The random forest is popular method that is applied in many fields (e.g., bioin-formatics, environmentrics, and so on). In this presentation, we extended the random forest method to analyze survival data. Our proposed model has weight parameters, which are estimated by lasso (Tibshirani, 1996), for each tree. We call this method regurarized random survival forest method. Therefore, in regurarized random survival forest method, the trees (base learner) that strongly influence survival time will have large estimated parameter values; the parameters of trees that lack influence will be estimated as zero (pruning). Evaluation of regurarized random forest method, using simulated and real data sets, indicated that regurarized random survival forest method performs better than the ordinaly random survival forest method.
机译:在使用决策树作为基本学习设备的整体学习方法中,随机森林方法是被广泛使用的方法之一。另一方面,在生命分析领域中,集成学习方法的研究还很少,它被用于对临床癌症研究的有效性进行统计评估。在本报告中,我们研究了随机森林方法在生存研究中的有效性。此外,我们提出了调整生存时间的随机森林方法,该方法基于减少的回归估计来调整每个基本学习者,以提高预测精度。通过文献实例检验了调整后的生存时间RandomForest方法的性能。结果,它显示出比现有生存时间随机森林法更好的结果。 %生存分析的重要主题之一是探讨影响生存时间的预后因素,最近,树结构化方法已用于评估协变量(例如,Crowley,2004年);但是,众所周知,这种方法具有提供了较差的预测模型。可以通过以线性组合方式对许多树进行建模来解决此问题,即集成学习。集成学习方法在机器学习和统计中得到了积极研究。随机森林是在许多领域中广泛使用的方法(在本次介绍中,我们扩展了随机森林方法来分析生存数据。我们提出的模型具有权重参数,该参数由套索估计(Tibshirani,1996),针对每棵树。我们称此方法为可调节的随机生存森林方法。因此,在可调节的随机生存森林方法中,对生存时间有重大影响的树(基础学习者)将具有较大的估计值。 d参数值;没有影响的树的参数将估计为零(修剪)。使用模拟和真实数据集对重新调节的随机森林方法进行评估,表明重新调节的随机生存森林方法的效果要好于通常的随机生存森林方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号