A Comparison of Classification Systems for Rule Sets Induced from Incomplete Data by Probabilistic Approximations

机译：概率近似从不完全数据引起的规则集的分类系统比较

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, we compare four strategies used in classification systems. A classification system applies a rule set, induced from the training data set in order to classify each testing case as a member of one of the concepts. We assume that both training and testing data sets are incomplete, i.e., some attribute values are missing. In this paper, we discuss two interpretations of missing attribute values: lost values and "do not care" conditions. In our experiments rule sets were induced using probabilistic approximations. Our main results are that for lost value data sets the strength only strategy is better than conditional probability without support and that for "do not care" data sets the conditional probability with support strategy is better than strength only.

机译：在本文中，我们比较分类系统中使用的四种策略。分类系统应用从训练数据集引起的规则集，以便将每个测试用例分类为其中一个概念的成员。我们假设培训和测试数据集都是不完整的，即，缺少某些属性值。在本文中，我们讨论了两个缺少属性值的解释：损失值和“不关心”条件。在我们的实验中，使用概率近似引起规则集。我们的主要结果是，对于损失的价值数据集，强度唯一的策略优于条件概率而不支持，因为“不关心”数据设置有条件概率，支持策略仅优于强度。

著录项

来源
《International Conference on Big Data, Small Data, Linked Data and Open Data》|2015年||共6页
会议地点
作者
Patrick G. Clark; Jerzy W. Grzymala-Busse;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TP311.13-53;
关键词
Data mining; Rough set theory; Probabilistic approximations; MLEM2 rule induction algorithm; Lost values and "do not care" conditions;

机译：数据挖掘;粗糙集理论;概率逼近;MLEM2规则感应算法;损失值和“不关心”条件;

相似文献

外文文献
中文文献
专利

1. Complexity of Rule Sets Mined from Incomplete Data Using Probabilistic Approximations Based on Generalized Maximal Consistent Blocks [J] . Patrick G. Clark, Jerzy W. Grzymala-Busse, Zdzislaw S. Hippe, Procedia Computer Science . 2020,第5期

机译：规则集的复杂性使用基于概括的最大一致块的概率近似地从不完整的数据开采
2. An Analysis of Probabilistic Approximations for Rule Induction from Incomplete Data Sets [J] . Patrick G. Clark, Jerzy W. Grzymala-Busse, Zdzislaw S. Hippe Fundamenta Informaticae . 2014,第3期

机译：来自不完整数据集的规则归纳的概率近似分析
3. A new classification rule for incomplete doubly multivariate data using mixed effects model with performance comparisons on the imputed data. [J] . Roy A Statistics in medicine . 2006,第10期

机译：使用混合效应模型对推算数据进行性能比较的不完全双变量数据的新分类规则。
4. A Comparison of Four Classification Systems Using Rule Sets Induced from Incomplete Data Sets by Local Probabilistic Approximations [C] . Patrick G. Clark, Cheng Gao, Jerzy W. Grzymala-Busse International symposium on methodologies for intelligent systems . 2017

机译：使用局部概率近似从不完整数据集导出规则集的四种分类系统的比较
5. A Comparison of the Quality of Rule Induction from Inconsistent Data Sets and Incomplete Data Sets. [D] . Su, Xiaomeng. 2015

机译：来自不一致数据集和不完整数据集的规则归纳质量的比较。
6. Incremental learning of probabilistic rules from clinical databases based on rough set theory. [O] . S. Tsumoto, H. Tanaka 1997

机译：基于粗糙集理论从临床数据库中增量学习概率规则。
7. Hierarchical fuzzy rule based classification systems with genetic rule selection for imbalanced data-sets [O] . Fernández Alberto, del Jesus María José, Herrera Francisco 2009

机译：不平衡数据集的基于遗传规则选择的层次模糊规则分类系统
8. Approximation by Complete and Incomplete Sets of Harmonic Polynomials. [R] . phipps, t. e. jr wrenn, a. 1972

机译：完全和不完备的调和多项式集的逼近。

A Comparison of Classification Systems for Rule Sets Induced from Incomplete Data by Probabilistic Approximations

摘要

著录项

相似文献

相关主题

期刊订阅