首页> 中文学位 >一种基于MACA的数据挖掘分类方法研究与应用
【6h】

一种基于MACA的数据挖掘分类方法研究与应用

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景

1.2主要内容

1.3论文的组织结构

2.1数据挖掘技术

2.1.1概述

2.1.2 Web数据挖掘

2.2数据挖掘分类技术

2.2.1分类问题

2.2.2常用分类算法

2.2.3分类性能评估指标

2.3本章小结

第三章基于MACA的分类器MACA-PCM

3.1多吸引子元胞自动机MACA

3.1.1元胞自动机概述

3.1.2多吸引子元胞自动机MACA基础

3.2基于MACA的分类器MACA-PCM

3.2.1分类器MACA-PCM的描述

3.2.2基于遗传算法的MACA-PCM进化分析

3.3 MACA-PCM的分类性能分析

3.4本章小结

第四章两阶段分类器TS-MACA-PCM的分析与设计

4.1 MACA的依赖字符串描述

4.1.1依赖向量DV和依赖字符串DS

4.1.2基于依赖字符串DS的MACA的描述

4.2两阶段分类器TS-MACA-PCM的设计

4.2.1两阶段分类器TS-MACA-PCM的结构设计

4.2.2基于遗传算法的TS-MACA-PCM进化分析

4.3 TS-MACA-PCM在数据挖掘系统中的应用

4.3.1分类算法设计

4.3.2分类性能测试

4.4本章小结

第五章TS-MACA-PCM在公安情报挖掘中的应用

5.1公安情报应用背景简介

5.1.1公安情报概述

5.1.2 Web数据挖掘在公安情报中的作用

5.2 TS-MACA-PCM在公安情报系统中的应用

5.2.1情报系统中的TS-MACA-PCM分类挖掘模型

5.2.2基于分布式环境的分类算法设计与性能分析

5.3本章小结

第六章总结和展望

6.1总结

6.2展望

参考文献

致 谢

在读期间发表的学术论文

展开▼

摘要

分类挖掘是数据挖掘技术中一个非常重要的方法。常用的典型分类挖掘方法有决策树、神经网络、遗传算法、贝叶斯方法和k—最临近分类法等,这些方法对各自适用的数据集都表现出较好的分类性能,但也表现出许多共有的不足。首先都属于内存驻留算法,须以数据量小为前提,对于海量数据,其有效构造分类模型的能力必显不足;其次,对在Internet上建立数据挖掘服务器所需的并行和分布式数据处理能力缺乏考虑;此外,分类精度和内存利用率等也有待提高。 论文针对分类挖掘技术的研究现状,设计了一种基于多吸引子元胞自动机、可有效地应用于数据挖掘系统中的两阶段分类器。该分类器在数据量处理能力、分布式数据处理、分类精度和内存利用等方面都有所改善。论文的具体研究内容和研究成果包括: (1)对基于多吸引子元胞自动机的分类器进行了重新描述,缩小了分类算法的查找空间。具体方法是以两个线性算子依赖向量DV和依赖字符串DS代替依赖矩阵来描述分类器; (2)设计了基于新描述方法的两阶段分类器,并利用遗传算法对分类器进行了优化处理,有效提高了分类器的分类速度。 (3)设计了基于两阶段分类器的数据挖掘分类算法,并在通用的实验平台WEKA上进行了分类性能测试。测试结果表明,相比较原基于多吸引子元胞自动机的分类器和C4.5、贝叶斯分类法等其他常用分类挖掘方法,所提出的两阶段分类器综合分类性能有明显提高。 (4)将所提出的两阶段分类器具体应用到公安情报挖掘系统中,提出了 Web公安情报挖掘系统中的分类模型,设计了在分布式数据挖掘环境中的相应分类算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号