首页> 外文会议>Australian Joint Conference on Artificial Intelligence >Ceoolectin gQuality Data for Database Mining
【24h】

Ceoolectin gQuality Data for Database Mining

机译:用于数据库挖掘的Ceoolectin GQuality数据

获取原文

摘要

Data collecting is necessary to some organizations such as nuclear power plants and earthquake bureaus, which have very small databases. Traditional data collecting is to obtain necessary data from internal and external data-sources and join all data together to create a homogeneous huge database. Because collected data may be untrusty, it can disguise really useful patterns in data. In this paper, breaking away traditional data collecting mode that deals with internal and external data equally, we argue that the first step for utilizing external data is to identify quality data in data-sources for given mining tasks. Pre- and post-analysis techniques are thus advocated for generating quality data.
机译:对于一些具有非常小的数据库的组织,诸如核电厂和地震局等组织是必要的。传统数据收集是从内部和外部数据源获取必要的数据,并将所有数据加入一起以创建一个均匀的巨大数据库。因为收集的数据可能是不可否信的,所以它可以伪装数据中的真实有用的模式。在本文中,断开传统的数据收集模式,同样地处理内部和外部数据,我们认为利用外部数据的第一步是识别给定挖掘任务的数据源中的质量数据。因此主张预先和分析后技术用于产生质量数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号