首页> 外文期刊>Przeglad statystyczny >ANALIZA PORÓWNAWCZA WYBRANYCH METOD SZACOWANIA BŁĘDU PREDYKCJI KLASYFIKATORA
【24h】

ANALIZA PORÓWNAWCZA WYBRANYCH METOD SZACOWANIA BŁĘDU PREDYKCJI KLASYFIKATORA

机译:估计分类器预测误差的几种方法的比较分析

获取原文
获取原文并翻译 | 示例
           

摘要

Klasyfikacją nazywamy algorytm postępowania, który przydziela badane obserwacje/obiekty, bazując na ich cechach do określonych populacji. W tym celu konstruowany jest odpowiedni model - klasyfikator. Miarą jego jakości jest przede wszystkim zdolność predykcyjna, mierzona m.in. za pomocą prawdziwego błędu predykcji. Wartość tego błędu, ze względu na brak odpowiednio dużej, niezależnej próby testowej, musi być często szacowana na podstawie dostępnej próby uczącej.Celem artykułu jest dokonanie przeglądu oraz empirycznej analizy porównawczej wybranych metod szacowania błędu predykcji klasyfikatora, skonstruowanego z wykorzystaniem liniowej analizy dyskryminacyjnej. Zbadano, czy wyniki analizy uzależnione są od wielkości próby oraz metody wyboru zmiennych do modelu. Badanie empiryczne zostało przeprowadzone na przykładzie problemu prognozowania upadłości spółek akcyjnych w Polsce.%Classification is an algorithm, which assigns studied companies, taking into consideration their attributes, to specific population. An essential part of it is classifier. Its measure of quality is especially predictability, measured by true error rate. The value of this error, due to lack of sufficiently large and independent test set, must be estimated on the basis of available learning set. The aim of this article is to make a review and compare selected methods for estimating the prediction error of classifier, constructed with linear discriminant analysis. It was examined if the results of the analysis depends on the sample size and the method of selecting variables for a model. Empirical research was made on example of problem of bankruptcy prediction of join-stock companies in Poland.
机译:分类是一种行为算法,可根据研究的观测/对象的特征将其分配给特定的人群。为此,构建了一个合适的模型-分类器。其质量的度量主要是预测能力,其中包括度量使用真实的预测误差。由于缺乏足够大的独立测试样本,该误差的值通常必须根据可用的学习样本进行估算。本文的目的是回顾和经验比较选择的使用线性判别分析构建的预测分类器误差的估算方法。检查了分析结果是否取决于样本量以及为模型选择变量的方法。以波兰的股份制公司破产预测问题为例进行了实证研究。%分类是一种算法,它根据研究对象的属性将研究公司分配给特定人群。分类器是必不可少的部分。它的质量度量尤其是可预测性,通过真实错误率来度量。由于缺乏足够大且独立的测试集,因此必须根据可用的学习集来估计此错误的值。本文的目的是对使用线性判别分析构建的分类器预测误差的估计方法进行回顾和比较。检查了分析结果是否取决于样本量以及为模型选择变量的方法。对波兰股份制公司破产预测问题的实例进行了实证研究。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号