...
首页> 外文期刊>International statistical review >Proportional Odds Models with High-Dimensional Data Structure
【24h】

Proportional Odds Models with High-Dimensional Data Structure

机译:具有高维数据结构的比例奇数模型

获取原文
获取原文并翻译 | 示例
           

摘要

Le modèle des odds proportionnels (rapports des chances proportionnels) est le modèle le plus couramment utilisé dans l'analyse de réponses de type ordinal. En présence d'un grand nombre de covariables possibles, l'approche par maximum de vraisemblance usuelle est typiquement mise en échec si toutes les covariables sont prises en compte. Une méthode de type boosting, pomBoost, est proposée, par laquelle le modèle est estimé via une sélection implicite des prédicteurs les plus pertinentes. Cette approche fait la distinction entre variables métriques et catégorielles. Dans le cas de variables catégorielles, l'objectif est une sélection simultanée d'un ensemble de prédicteurs. La méthode fait la distinction, de surcroît, entre variables nominales et ordinales. Dans ce dernier cas, la relation d'ordre intervient dans le calcul de la pénalisation. La méthode permet également d'imposer la présence de certaines covariables dans le modèle final. Les performances de l'algorithme de boosting sont évaluées, du point de vue de l'erreur quadratique moyenne et de l'erreur de prédiction, au moyen d'une étude de simulation et d'applications à des données empiriques.Les taux de succès et de fausse alarme sont considérés pour l'évaluation des performances de pomBoost dans la sélection des prédicteurs.%The proportional odds model is the most widely used model when the response has ordered categories. In the case of high-dimensional predictor structure, the common maximum likelihood approach typically fails when all predictors are included. A boosting technique pomBoost is proposed to fit the model by implicitly selecting the influential predictors. The approach distinguishes between metric and categorical predictors. In the case of categorical predictors, where each predictor relates to a set of parameters, the objective is to select simultaneously all the associated parameters. In addition, the approach distinguishes between nominal and ordinal predictors. In the case of ordinal predictors, the proposed technique uses the ordering of the ordinal predictors by penalizing the difference between the parameters of adjacent categories. The technique has also a provision to consider some mandatory predictors (if any) that must be part of the final sparse model. The performance of the proposed boosting algorithm is evaluated in a simulation study and applications with respect to mean squared error and prediction error. Hit rates and false alarm rates are used to judge the performance of pomBoost for selection of the relevant predictors.
机译:比例赔率模型(比例赔率比)是顺序响应分析中最常用的模型。在存在大量可能的协变量的情况下,如果考虑所有协变量,通常会破坏通常的最大似然法。提出了一种增强方法pomBoost,通过隐式选择最相关的预测变量来估计模型。此方法区分指标变量和分类变量。对于分类变量,目标是同时选择一组预测变量。该方法还区分名义变量和有序变量。在后一种情况下,顺序关系介入惩罚的计算。该方法还可以在最终模型中强加某些协变量。从均方误差和预测误差的角度,通过模拟研究和对经验数据的应用,评估了升压算法的性能。在选择预测变量时,将考虑使用pomBoost和false警报来评估pomBoost的性能。%当响应已排序类别时,比例赔率模型是使用最广泛的模型。在高维预测变量结构的情况下,当包含所有预测变量时,常见的最大似然方法通常会失败。提出了一种提升技术pomBoost通过隐式选择有影响力的预测变量来拟合模型。该方法区分度量和分类预测器。对于分类预测器,其中每个预测器都与一组参数相关,目标是同时选择所有关联的参数。另外,该方法区分名义和顺序预测变量。在顺序预测变量的情况下,所提出的技术通过惩罚相邻类别参数之间的差异来使用顺序预测变量的顺序。该技术还具有考虑必须作为最终稀疏模型一部分的某些强制性预测变量(如果有)的规定。在模拟研究和应用中针对均方误差和预测误差评估了所提出的提升算法的性能。命中率和误报率用于判断pomBoost的性能,以选择相关的预测变量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号