首页> 外国专利> Method for finding a best test for a nominal attribute for generating a binary decision tree

Method for finding a best test for a nominal attribute for generating a binary decision tree

机译:为生成二进制决策树的名义属性找到最佳测试的方法

摘要

A fast way for determining the best subset test for a nominal attribute in a decision tree. When a nominal attribute has n distinct values, the prior art requires computing the impurity functions on each of the 2.sup.n-1 -1 possible subset partitioning of the n values and finding the minimum case among them. This invention guarantees the minimum impurity test on the attribute by computing only (n-1) impurity function computations. This reduction of computational complexity makes it practically possible to find the true best tests for many real data mining application, where a binary decision tree is used as the classification model.
机译:确定决策树中名义属性的最佳子集测试的快速方法。当名义属性具有n个不同的值时,现有技术需要在n值的​​2.sup.n-1 -1个可能子集分区中的每一个上计算杂质函数,并在其中找到最小的情况。本发明通过仅计算(n-1)个杂质函数计算来保证对属性的最小杂质测试。计算复杂度的降低使得实际上有可能为许多实际的数据挖掘应用找到真正的最佳测试,其中将二进制决策树用作分类模型。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号