从数据集中挖掘频繁函数集的研究和应用

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

数据挖掘是当前数据库研究开发和应用的热点。函数挖掘是从科学数据中发现有效的函数关系，它是数据挖掘技术的重要研究方向。　　传统的函数挖掘本身具有很多局限性，在实际问题中难于应用：(1)挖掘目标是单个函数，但单个函数对现实世界中规律的描述能力很弱；(2)它难以被应用在复杂的数据集上。为了弥补这些缺陷，本文做了如下探索： (1)对函数挖掘的概念进行了扩展，提出了新的、描述能力更强的函数挖掘对象——频繁函数集(FFS)，这一新概念旨在描述在指定数据集上具有一定支持度的函数关系簇。　　(2)分析了频繁函数集的性质。 (3)提出了可配置的FFS挖掘算法——ConfigurableFrequentFunctionSetDiscoveringAlgorithm(CFFSDA)，它灵活，可以配置使用多种搜索算法。 (4)分析CFFSDA的不足，进一步提出了可以满足用户不同兴趣需求的基于约束的频繁函数集(ConstrainedFFS)和相应的挖掘框架。 (5)基因表达式编程(GEP)是函数关系挖掘的新方法，本文利用GEP配置实化了CFFSDA，并且在GEP研究中首次采用了精度阈值队列策略(PTQ)，该策略有效地提高了算法的成功概率。 (6)探索了FFS在数据库查询优化和分类中的应用。举例说明了利用FFS进行查询优化，在其WHERE子句有等值条件和某些比较条件的SQL选择语句中，比传统查询优化策略有更好的效率。 (7)通过实验证实了FFS的强大描述能力和FFS在分类中的应用。同时也证实了PTQ的有效性，它使算法在挖掘高精度复杂函数时的成功概率提高了55倍。

著录项

作者
贾晓斌;
展开▼
作者单位

四川大学;

展开▼
授予单位四川大学;
学科计算机应用
授予学位硕士
导师姓名唐常杰;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
数据挖掘; 频繁函数集; 基因表达式编程; 函数挖掘;

相似文献

中文文献
外文文献
专利

1. 长生物数据集中频繁闭合模式挖掘算法研究 [J] . 周明 ,李宏 . 计算机工程 . 2007,第002期
2. 从不确定数据集中挖掘频繁Co-location模式 [J] . 陆叶 ,王丽珍 ,张晓峰 . 计算机科学与探索 . 2009,第006期
3. HTCLOSE:快速挖掘微阵列数据集中的频繁闭合模式 [J] . 缪裕青 ,金波 ,陈国良 . 小型微型计算机系统 . 2008,第002期
4. 高维大数据集中频繁闭合模式的挖掘 [J] . 余光柱 ,王亮 ,易先军 . 计算机工程 . 2008,第017期
5. 高效数据挖掘算法在大规模数据集中的应用研究 [J] . 卓广平 . 软件 . 2014,第008期
6. 频繁函数集的可配置挖掘算法 [C] . 贾晓斌 ,唐常杰 ,钟义啸 . 第二十一届中国数据库学术会议 . 2004
7. 垂直数据格式挖掘频繁项集在Web日志挖掘中应用研究 [A] . 安维国 . 2017

从数据集中挖掘频繁函数集的研究和应用

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅