首页> 中文学位 >数据分类挖掘在人格特征分析方面的应用研究
【6h】

数据分类挖掘在人格特征分析方面的应用研究

代理获取

目录

文摘

英文文摘

第一章 绪论

第一节 数据挖掘的发展现状及主要研究内容

1.1.1 数据挖掘的发展现状

1.1.2 数据挖掘的研究内容

第二节 论文的研究背景及意义

第三节 论文内容及组织结构

第二章 数据分类挖掘算法概述

第一节 数据分类挖掘的含义

2.1.1 数据分类的概念

2.1.2 数据分类的过程

2.1.3 数据分类的常用方法

2.1.4 数据分类与预测的区别

第二节 数据分类挖掘的定义

第三节 数据分类挖掘的算法与实现

2.3.1 决策树分类算法的原理

2.3.2 贝叶斯分类器的原理

2.3.3 分类规则学习器的原理

第四节 本章小节

第三章“人格特征数据库”的数据预处理

第一节 心理测验简介

第二节 心理测验的使用

3.2.1 心理测验的实施要领

3.2.2 心理测验的计分方法

3.2.3 心理测验的结果的解释

3.2.4 人格测验的含义

第三节 艾森克人格特征心理测试

第四节 人格特征数据库简介

3.4.1 数据来源及目的

3.4.2“人格特征数据库”结构以及内容:

3.4.3“人格特征数据库”的数据预处理

第五节 本章小结

第四章 分类挖掘算法在“人格特征数据库”中的实现

第一节 机器学习概述

第二节 weka系统简介

第三节 评估机器学习成果

第四节 各种不同的学习算法在“人格特征数据库”中的实验

4.4.1 决策树分类算法在“人格特征数据库”中的实现

4.4.2 朴素贝叶斯分类在人格特征数据库中的实现

4.4.3 基于规则的分类算法在人格特征数据库中的实现

第五节 本章小节

第五章“人格特征数据库”中不同学习方案的比较

第一节 三种分类学习方案结果的比较

5.1.1 分类模型的测试

5.1.2 三种学习方案的比较

第二节“人格特征数据库”中分类学习结果分析

第三节 本章小节

第六章 总结与展望

第一节 总结

第二节 展望

参考文献

致谢

个人简历

展开▼

摘要

近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。数据挖掘被定义为从大量数据中提取或“挖掘”知识或模式的过程。
   分类是数据挖掘中一个非常重要的研究课题,它用于提取描述重要数据类的模型。本文利用三种不同的分类学习方案对“人格特征数据库”进行了分类数据挖掘。目的是寻找出该数据库中的分类知识,并比较不同的分类学习方案在该数据库中的性能表现。
   “人格特征数据库”是对200多名中专生进行艾森克人格问卷调查得到的数据,在该数据表中共有五个属性。其中前四个属性是数值属性,即通过问卷采用T测试描述的每一个被试者的各种因子得分数值;而第五个属性为类别属性,是通过前面四项的得分确定的每一个被试者的气质类型。根据艾森克人格三维度理论,按人格特征不同,把人的气质类型分为四种:抑郁质、粘液质、胆汁质、多血质。本文利用不同的分类算法对该数据库中的数据进行了分类规则的挖掘,寻找隐藏在这些数据中的规律,以确定每种气质类型的个体具有哪些数值特征,并对不同的分类算法进行了性能分析和比较。
   本文的主要研究工作如下:
   1、深入探讨了分类算法中的决策树算法,贝叶斯分类算法和基于规则的分类算法各自的原理、工作流程和特点。
   2、对“人格特征数据库”中的数据表的内容进行了数据预处理,以便于对其进行深入的分类挖掘。
   3、针对“人格特征数据库”采用决策树C4.5、SLIQ、SPRINT三种算法描述了模型建立的过程,并实现了决策树算法在该数据表上模型的建立。作为比较使用weka机器学习器中NaiveBayes和Nnge实现了数据分类挖掘,并得到各自的分类结果。
   4、在此基础上对上述三种学习方案得到的结果进行了测试、分析和比较。从而对三种算法之间的性能进行比较,最后得出结论:经典的决策树学习方案具有准确率高、明了易懂的特点,最适合“人格特征数据库”的分类研究。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号