Avalia??o da performance do algoritmo J48 para constru??o de modelos baseados em árvores de decis?o

Elamara Marama de Araujo Vieira; Nívea Trindade de A. T. Neves; Ana Carolina C. de Oliveira; Ronei Marcos de Moraes; Jo?o Agnaldo do Nascimento

首页> 外文期刊>Revista Brasileira de Computao Aplicada >Avalia??o da performance do algoritmo J48 para constru??o de modelos baseados em árvores de decis?o

【24h】

Avalia??o da performance do algoritmo J48 para constru??o de modelos baseados em árvores de decis?o

机译：基于决策树的J48建立模型算法的性能评估

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

As árvores de decis?o s?o modelos hierárquicos utilizados em várias áreas do conhecimento por sua capacidade preditiva e de resolu??o de problemas de maneira simples e objetiva. Entretanto, apresentam algumas limita??es relacionadas à sua adequa??o à base de dados e ao se atentar quanto aos procedimentos para sele??o dos parametros de crescimento e poda a serem adotados. Desta forma, têm-se como objetivo avaliar e discutir a performance do algoritmo J48 para constru??o de modelos de tomada de decis?o em árvore em base de dados com atributos de diferentes tipos. Para tanto, realizaram-se experimentos em 10 bases de dados disponíveis em repositório internacional, considerando como variantes os métodos de treinamento, teste e poda, aplicados em toda base de dados e com o uso dos métodos Wrapper e CFS (Correlation-based Feature Selection) para sele??o de atributos. Identificou-se que na presen?a de dados contínuos, os únicos modelos que apresentaram boa capacidade preditiva estiveram presentes em situa??es em que a grande quantidade de exemplos puderam compensar tal deficiência. Os modos de treinamento "valida??o cruzada" e "divis?o por porcentagem" mostraram-se similares em suas predi??es quando ajustados a 10 folds e 75%, respectivamente. Ademais, a sele??o de atributos n?o foi capaz de gerar melhores predi??es denotando que tal método de forma isolada n?o compensa possíveis inadequa??es nas bases de dados. Pode-se constatar que os resultados referentes à capacidade preditiva dos modelos s?o fortemente direcionados pelo quantitativo de exemplos pertencentes à base, presen?a de dados contínuos e de dados com ruído.

机译：决策树是用于各个知识领域的分层模型，它们具有以简单客观的方式预测和解决问题的能力。但是，它们在与数据库适应性以及注意选择要采用的生长和修剪参数的程序方面存在一些限制。因此，目标是评估和讨论J48算法在具有不同类型属性的数据库中的树中构建决策模型的性能。为此，在国际存储库中的10个数据库上进行了实验，考虑了作为变体应用于整个数据库的训练，测试和修剪方法，并使用了Wrapper和CFS（基于相关性的特征选择）方法）以选择属性。可以确定，在存在连续数据的情况下，只有大量示例可以弥补这一不足的情况下，才会出现显示出良好预测能力的唯一模型。当分别调整为10倍和75％时，训练模式“交叉验证”和“按百分比划分”证明是相似的。另外，属性的选择不能产生更好的预测，这表明孤立地使用这种方法不能弥补数据库中可能的不足。可以看出，关于模型的预测能力的结果在很大程度上取决于属于数据库的示例数，连续数据的存在和带有噪声的数据。

著录项

来源
《Revista Brasileira de Computao Aplicada》 |2018年第2期|共11页
作者
Elamara Marama de Araujo Vieira; Nívea Trindade de A. T. Neves; Ana Carolina C. de Oliveira; Ronei Marcos de Moraes; Jo?o Agnaldo do Nascimento;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类计算技术、计算机技术;
关键词

相似文献

外文文献
中文文献
专利

1. Avalia??o de cinco algoritmos de árvores de decis?o e três tipos de modelos digitais de eleva??o para mapeamento digital de solos a nível semidetalhado na Bacia do Lageado Grande, RS, Brasil [J] . Alfred Eduard Hartemink, Carlos Gustavo Tornquist, Elvio Giasson, Ciência Rural . 2013,第11期

机译：巴西拉吉亚多格兰德盆地半详细水平的五种决策树算法和三种数字高程模型用于数字土壤制图的评估
2. Modelo de gest?o municipal baseado na utiliza??o estratégica de recursos da tecnologia da informa??o para a gest?o governamental: formata??o do modelo e avalia??o em um município [J] . Denis Alcides Rezende, Leonardo De Oliveira Leite Revista de Administrao Pública . 2010,第2期

机译：基于信息技术资源对政府管理的战略使用的市政管理模型：对模型进行格式化和评估
3. Mapeamento da vegeta??o na floresta atlantica usando o classificador de árvore de decis?o para integrar dados de sensoriamento remoto e modelo digital de terreno [J] . Carvalho Júnior Osmar Abílio de, Coelho Marcus Alberto Nadruz, Martins éder de Souza, Revista Brasileira de Geofisica . 2008,第3期

机译：使用决策树分类器整合遥感数据和数字地形模型，绘制大西洋森林中的植被图
4. Proposta de Modelo de Migracao de Data Center Virtualizado para Modelo de Nuvem Privada para o Novo Polo de Tecnologia da Informacao do Exercito Brasileiro [C] . Nathaniel Simch de Morais, Andre Costa Drummond, Aleteia Patricia F. de Araujo Iberian Conference on Information Systems and Technologies . 2017

机译：纽约指示技术POLO私有云模型的虚拟化数据中心迁移模型提案
5. Designing Commoning: A Design Research About the Challenges of Building Sustainable Collaborations for Urban Transitions =Designing commoning: uma investiga??o em design sobre desafios da constru??o de colabora??es sustentáveis para transi??es urbanas [D] . Barbosa, Janaina Teles. 2019

机译：设计共同：设计城市过渡可持续合作挑战的研究=设计共同：城市过渡可持续协作挑战设计的调查
6. Desenvolvimento de modelo clínico para predição da possibilidade de identificação da artéria de Adamkiewicz por angiotomografia [O] . Alexandre Campos Moraes Amato, José Rodrigues Parga Filho, Noedir Antônio Groppo Stolf, 2018

机译：建立临床模型以预测通过血管造影术确定Adamkiewicz动脉的可能性
7. Avaliação da performance do algoritmo J48 para construção de modelos baseados em árvores de decisão [O] . Elamara Marama de Araujo Vieira, Nívea Trindade de A. T. Neves, Ana Carolina C. De Oliveira, 2018

机译：基于决策树的模型建设J48算法评价
8. Relatorio DA Fase 1 Do Projeto Estima Desenvolvimento de Um Modelo Para Estimativa DA Produtividade Agricola DA Cana-de-Acucar Baseado Em Dados Landsat E Agrometeorologicos (Report on Phase 1 of the Project Estimate Development of [R] . Rudorff, B. F. T., Batista, G. T. 1988

机译：Relatorio Da Fase 1 Do projeto Estima Desenvolvimento de Um modelo para Estimativa Da produtividade agricola Da Cana-de-acucar Baseado Em Dados Landsat E agrometeorologicos（项目第一阶段报告估算

Avalia??o da performance do algoritmo J48 para constru??o de modelos baseados em árvores de decis?o

摘要

著录项

相似文献

相关主题

期刊订阅