大规模科学数据挖掘中密度聚类算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘就是从海量数据中提取知识，又被称为数据库中的知识发现。它是一个跨学科的新兴研究领域。聚类分析是其中的一个重要分支，它研究数据间逻辑上或物理上的相互关系，通过一定的规则将数据集划分为在性质上相似的数据点构成的若干个类。本文首先介绍了数据挖掘的基本概念、存在问题及发展方向。其次介绍了聚类分析的基本概念、分类及一些常见的算法思想，并着重讨论了一些经典的聚类算法。基于密度的聚类算法是本文的重点研究对象。研究表明，大多数基于密度的聚类算法需要输入初始参数，参数通常由用户根据经验给出，这往往是困难的。且密度参数通常简单的将聚类分为高低密度两种，无法反映整体数据的分布特点。为了解决此类算法面临的问题，本文提出一种基于密度与网格聚类算法相结合的自适应式聚类算法，它首先对数据进行网格化，然后分析网格的密度分布，从而自适应的得出一系列密度区间，这些区间的划分进而作为聚类的参数。这样的区间划分不再是简单的高低密度分界，而是反映了数据分布的特点。数据挖掘与科学研究的结合是近来新兴的研究课题，在很多方面都有值得研究的地方。大规模科学数据具有数据量大、特征复杂的特点，在对其进行处理时，往往使得理解、分析这些科学数据，并从中获取知识变得十分困难，由此科学数据挖掘势在必行。本文对科学数据挖掘项目及其科学仿真数据进行了介绍，并且将所提出的自适应式网格密度聚类算法应用于科学仿真数据。并对聚类结果进行聚类特征的分析提取，提取的聚类特征表示了数据的整体物理变化过程。在本文的最后对全文内容进行总结，并展望了数据挖掘进一步研究和应用的方向。

著录项

作者
熊小勇;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机应用技术
授予学位硕士
导师姓名傅彦;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘; 数据库技术; 聚类算法;

相似文献

中文文献
外文文献
专利

1. 数据挖掘中密度聚类算法研究 [J] . 叶培松 ,顾国松 . 福建电脑 . 2010,第003期
2. 一种改进型聚类算法应用于科学数据挖掘 [J] . 杨朝敏 ,李欣宇 . 成都信息工程学院学报 . 2006,第003期
3. 结合DBSCAN聚类算法和粒子群算法的大规模路径优化方法研究 [J] . 丁乔 ,李旭 ,王建春 . 物流科技 . 2020,第004期
4. 大规模数据集聚类算法的研究进展分析 [J] . 邢春燕 . 花炮科技与市场 . 2020,第002期
5. 大规模数据集聚类算法的研究进展 [J] . 何玉林 ,黄哲学 . 深圳大学学报（理工版） . 2019,第001期
6. 面向大规模图数据的分布式并行聚类算法研究 [C] . Chen Dehua ,陈德华 ,Xie Wei . 第29届中国数据库学术会议 . 2012
7. 大规模数据挖掘聚类算法的研究与实现 [A] . 崔日新 . 2013

大规模科学数据挖掘中密度聚类算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅