IDENTIFICA??O DE OUTLIERS EM DADOS DE ACIDENTES DE TR?NSITO NO BRASIL: ANáLISE DE CLUSTER VERSUS MéTODOS ESTATíSTICOS

Philippe Barbosa Silva; Sara Maria Pinho Ferreira; Zafeiris Kokkinogenis; Michelle Andrade

首页> 外文期刊>Revista de Engenharia e Tecnologia >IDENTIFICA??O DE OUTLIERS EM DADOS DE ACIDENTES DE TR?NSITO NO BRASIL: ANáLISE DE CLUSTER VERSUS MéTODOS ESTATíSTICOS

【24h】

IDENTIFICA??O DE OUTLIERS EM DADOS DE ACIDENTES DE TR?NSITO NO BRASIL: ANáLISE DE CLUSTER VERSUS MéTODOS ESTATíSTICOS

机译：巴西交通事故数据中主要成分的识别：聚类分析与统计方法

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

A avalia??o e tratamento inicial dos dados é fundamental em qualquer análise de acidentes de transito e desenvolvimento de modelos. Um dos aspectos que pode induzir ao enviesamento dos resultados é a n?o identifica??o ou tratamento de valores discrepantes, os outliers . Neste trabalho investigou-se o potencial do uso de análise de cluster para detec??o de outliers frente às técnicas estatísticas tradicionalmente utilizada para tal finalidade. Foram utilizados 28.034 registros de acidentes, acumulados de 2011 a 2016 num trecho de 170 km da BR-116/RJ. Dentre as técnicas estatísticas, o método do desvio-padr?o apresentou razoabilidade nos resultados, mas dificuldade na aplica??o conjunta dos limites univariados de valores discrepantes. Já os métodos Boxplot e MAD se revelaram inadequados para a detec??o de outliers na base de dados analisada, uma vez que conduziram a resultados incoerentes e sem consistência prática. A análise de cluster (algoritmo k-means ), doutro lado, demonstrou ter potencial para aplica??o a este tipo de problema, tendo identificado conjuntos coerentes de outliers para a base de dados. O método n?o tem rígidas limita??es a pressupostos estatísticos, é adequado a grandes bases de dados, permite a avalia??o multivariada dos dados e ainda, a análise combinada de dados categóricos e numéricos. Ainda assim, o emprego do método deve ser feito de forma a tirar proveito dos pontos fortes da técnica e minimizar suas limita??es.

机译：数据的初始评估和处理对于任何交通事故分析和模型开发都是至关重要的。可能导致结果出现偏差的方面之一是无法识别或处理异常值，即异常值。在这项工作中，我们调查了使用聚类分析针对传统上用于此目的的统计技术检测异常值的潜力。使用了28,034起事故记录，从2011年到2016年累积了170公里的BR-116 / RJ事故记录。在统计技术中，标准差方法在结果上是合理的，但是在联合应用离群值单变量极限时比较困难。事实证明，Boxplot和MAD方法不足以在分析的数据库中检测异常值，因为它们导致不一致的结果且没有实际的一致性。另一方面，聚类分析（k-means算法）通过为数据库确定了异常值的连贯集，证明了可应用于此类问题的潜力。该方法对统计假设没有严格的限制，适用于大型数据库，可以对数据进行多元评估，并且可以对分类和数值数据进行组合分析。即使这样，也必须使用该方法，以利用该技术的优势并最小化其局限性。

著录项

来源
《Revista de Engenharia e Tecnologia》 |2019年第1期|共12页
作者
Philippe Barbosa Silva; Sara Maria Pinho Ferreira; Zafeiris Kokkinogenis; Michelle Andrade;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类工业技术;
关键词
入库时间 2022-08-18 15:41:35

相似文献

外文文献
中文文献
专利

1. Aplica??o de métodos geoestatísticos para identifica??o de dependência espacial na análise de dados de um ensaio de espa?amento florestal em delineamento sistemático tipo leque [J] . Oda-Souza Melissa, Barbin Décio, Ribeiro Júnior Paulo Justiniano, Revista rvore . 2008,第3期

机译：地静态方法在采样类型中林业空间试验数据分析中的空间依赖性识别的应用
2. ANáLISE DO NíVEL DE ABERTURA DE DADOS GOVERNAMENTAIS DA áREA DO TR?NSITO NO BRASIL [J] . Ricardo Matheus, Denis Rodrigues, José Carlos Vaz, Revista Eletrnica de Sistemas de Informao . 2016,第2期

机译：巴西交通区域政府数据公开水平的分析
3. Uma Análise da Aplica??o de Três Métodos Estatísticos para o Cálculo do Desvio Padr?o da Dire??o do Vento na Regi?o Tropical [J] . Silva Adaiana Francisca Gomes da, Zaparoli Edson Luiz, Fisch Gilberto Revista Brasileira de Meteorologia . 2016,第1期

机译：三种统计方法在热带地区风向标准偏差计算中的应用分析
4. Análise de Desempenho do MongoDB--Um comparativo entre instala??es standalone e sharded cluster na análise de dados abertos do Programa Bolsa Família [C] . Aloísio Dourado Neto, Eduardo Pires Fernandes, Maristela Holanda, Conference on Information Systems and Technologies . 2017

机译：MongoDB性能分析 - 独立安装与博尔萨Família计划开放数据分析中的比较
5. Indocumentados en tránsito: Representaciones contemporáneas de precariedad, muerte y resistencia =Undocumented Lives in Transit: Contemporary Representations of Precariousness, Death and Resistance [D] . Monroe, Maria Teresa. 2020

机译：在过境中无表行：当代的不漫气，死亡和抵抗的代表性= undocumente生活在过境中：当代的不稳定，死亡和抵抗的代表性
6. ANÁLISE DA INSERÇÃO DOS TEMAS DE HUMANIDADES E ÉTICA COM METODOLOGIA DE APRENDIZAGEM BASEADA EM PROBLEMAS EM CURRICULO MÉDICO INTEGRADO EM ESCOLA PÚBLICA NO DISTRITO FEDERAL BRASIL [O] . Maria Rita Carvalho Garbi Novaes, Luiz Carlos Garcez Novaes, Dirce Guilhem, -1

机译：分析了人文与道德的主题基于问题的学习方法在巴西联邦区的公立学校的医学课程中纳入了基于问题的学习方法
7. Os Dados estatísticos das causas de acidentes de trânsito nas rodovias federais de Santa Catarina como instrumento estratégico na redução de acidentes [O] . Motta João Batista 2009

机译：圣卡塔琳娜州联邦高速公路交通事故原因统计数据，作为减少事故的战略工具
8. DADOS NUCLEARES, DE ALGUNS RADIOISÓTOPOS, ÚTEIS EM ESPECTROMETRIA DE RAIOS GAMA E EM ANÁLISE POR ATIVAÇÃO [R] . Laura T. Atalla 1968

机译：DaDOs NUCLEaREs，DEaLGUNsRaDIOIsÓTOpOs，ÚTEIsEmEspECTROmETRIa DE RaIOs GamaEmEmaÁLIsEpORaLTIVaÇÃO

IDENTIFICA??O DE OUTLIERS EM DADOS DE ACIDENTES DE TR?NSITO NO BRASIL: ANáLISE DE CLUSTER VERSUS MéTODOS ESTATíSTICOS

摘要

著录项

相似文献

相关主题

期刊订阅