首页> 外文会议>British national conference on databases;BNCOD 14 >Speeding up Knowledge Discovery in Large Relational Databaswes by means of a New Discretization ALgorithm
【24h】

Speeding up Knowledge Discovery in Large Relational Databaswes by means of a New Discretization ALgorithm

机译:通过新的离散化算法加快大关系数据库中的知识发现

获取原文

摘要

Most of the KDD algoithms proposed in the literature have been applie to relatively small datasets and do not permit any integration with a DBMS. Hence, the application of these algorithms to the huge amounts of data found in current databsases and data warehouses faces seriious scalability problems, particularly the porblem of excessive learning tiem. THis paper investigates a way of improving the scalability of KDD algorithms, via discretization of ordinal or continuous attributes. This work has two novel aspects. First, we map a genric discretization primitive into an SQL query. Second, we propose a new discretization algorithm for classification tasks. We show how the new discretization algorithm can be implemented with good effect via the SQL primitive.
机译:文献中提出的大多数KDD替代已经应用于相对较小的数据集,不允许与DBMS进行任何集成。 因此,将这些算法应用于当前数据库和数据仓库中发现的大量数据,面临着导致的可扩展性问题,特别是过度学习的巨大群体。 本文通过序数或连续属性的离散化来研究提高KDD算法可扩展性的方法。 这项工作有两种新颖方面。 首先,我们将原始的纠正性分歧原始映射到SQL查询中。 其次,我们提出了一种用于分类任务的新的离散化算法。 我们展示了如何通过SQL原语来实现新的离散化算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号