首页> 中文学位 >数据挖掘的模糊系统实现
【6h】

数据挖掘的模糊系统实现

代理获取

目录

摘要

引言

第一章模糊系统

第二章聚类算法评述

第三章基于最小体积聚类的模糊建模

3.1最小体积聚类

3.2基于最小体积聚类的模糊建模

3.3本章小结

第四章输入选择问题

4.1输入选择问题简介

4.2基于聚类的输入选择

4.3基于一致性测度的输入选择

4.4本章小结

第五章结语

参考文献

作者在攻读硕士学位期间发表、录用及完成的论文

致谢

展开▼

摘要

“数据挖掘”的目标是要从错综复杂的数据中去发现某种重要的模式和趋势,真正地去理解数据的内涵,模糊系统正是“数据挖掘”的一个理想的系统和方法。模糊系统有着非常灵活的数学结构,是一种高效的万能逼近器。更为重要的是,模糊系统的规则库能为我们提供许多隐藏在数据中的知识,并以规则的形式为人们所用。但是,这并不意味着模糊系统已经完美无缺。 1.现有模糊建模的许多方法仅仅是从函数逼近这个角度来研究,即如何改进函数逼近精度以及建模的速度。这只是从模糊系统是万能逼近的性质方面来进行模糊建模,如何更加充分地利用各种信息尤其是来自于数据的信息呢? 2.当面对高维数据,现有的模糊系统依然面临着维数灾难的问题:模糊规则的指数增长;大量参数需要拟合而却只有十分稀疏的数据散落在高维空间等等。 本文针对这两个问题,提出了我们自己的方法。1.我们处理规则爆炸的基本思想来源于聚类。所谓“人以群分,物以类聚”,相似的数据被划分为一类,然后对每一类仅用一条规则进行描述。这样规则数将不会随维数的增长而指数增长,而是与数据本身的特征联系起来。 2.为了获得更为有效的论域划分,我们研究了现有的各种聚类方法,比较了它们各自的优缺点,并最终提出了两种基于MCV聚类的模糊建模新方法。本文详细地讨论了这两种方法获取的隶属度函数的特点,以及参数估计方面的性质,并把这两种方法与其它经典的方法进行了比较。从数据挖掘这个角度看,我们的方法不仅具有很好的预测能力,还提供了更简洁的规则库,为分析问题的本质和发现数据中隐含的知识提供了更好的工具。 3.如何处理高维问题?输入选择应该是关键的第一步。它不仅起到了降维的作用,还能增加模型的可解释性并减少计算量。 我们在本文中提出了两种基于常识的输入选择方法,一种是基于灵敏度分析的输入选择,另一种是基于数据一致性的输入选择。这两种方法的出发点看似完全不同,其实是等价的,我们的分析表明了这两种方法本质上的联系,大量的实验也证明了这两种输入选择方法的有效性。 本文对许多著名数据挖掘问题进行了较全面的分析,如MPG预测问题,Box-Jenikin煤气炉问题,波士顿住房问题,得到了许多形象、生动、有趣的结论。

著录项

  • 作者

    杨灿;

  • 作者单位

    浙江大学;

  • 授予单位 浙江大学;
  • 学科 控制理论与控制工程
  • 授予学位 硕士
  • 导师姓名 朱善安;
  • 年度 2005
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP273.4;
  • 关键词

    数据挖掘; 模糊系统; 模糊建模; 函数逼近;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号