首页> 外文学位 >Data mining with relational database management systems.
【24h】

Data mining with relational database management systems.

机译:使用关系数据库管理系统进行数据挖掘。

获取原文
获取原文并翻译 | 示例

摘要

With the increasing demands of transforming raw data into information and knowledge, data mining becomes an important field to the discovery of useful information and hidden patterns in huge datasets. Both machine learning and database research have made major contributions to the field of data mining. However, there is still little effort made to improve the scalability of algorithms applied in data raining tasks. Scalability is crucial for data mining algorithms, since they have to handle large datasets quite often. In this thesis we take a step in this direction by extending a popular machine learning software, Weka3.4, to handle large datasets that can not fit into main memory by relying on relational database technology. Weka3.4-DB is implemented to store the data into and access the data from DB2 with a loose coupling approach in general. Additionally, a semi-tight coupling is applied to optimize the data manipulation methods by implementing core functionalities within the database. Based on the DB2 storage implementation, Weka3.4-DB achieves better scalability, but still provides a general interface for developers to implement new algorithms without the need of database or SQL knowledge.
机译:随着将原始数据转换为信息和知识的需求不断增长,数据挖掘已成为发现有用信息和巨大数据集中隐藏模式的重要领域。机器学习和数据库研究都为数据挖掘领域做出了重大贡献。但是,仍然很少有努力来改善应用于数据下雨任务的算法的可伸缩性。可伸缩性对于数据挖掘算法至关重要,因为它们必须经常处理大型数据集。在本文中,我们通过扩展流行的机器学习软件Weka3.4朝这个方向迈出了一步,依靠依赖关系数据库技术来处理无法放入主存储器的大型数据集。 Weka3.4-DB的实现通常是使用松散耦合方法将数据存储到DB2中以及从DB2中访问数据。此外,通过在数据库中实现核心功能,应用了半紧密耦合来优化数据处理方法。 Weka3.4-DB基于DB2存储实现,可实现更好的可伸缩性,但仍为开发人员提供了通用接口,无需数据库或SQL知识即可实现新算法。

著录项

  • 作者

    Zou, Beibei.;

  • 作者单位

    McGill University (Canada).;

  • 授予单位 McGill University (Canada).;
  • 学科 Computer Science.
  • 学位 M.Sc.
  • 年度 2005
  • 页码 88 p.
  • 总页数 88
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号