首页> 中文学位 >基于集成学习的中医病案数据挖掘方法研究
【6h】

基于集成学习的中医病案数据挖掘方法研究

代理获取

目录

第一个书签之前

基于集成学习的中医病案数据挖掘方法研究

基于集成学习的中医病案数据挖掘方法研究

摘 要

Research on data mining method of medical record i

ABSTRACT

1 绪论

1.1 课题研究背景及意义

1.1.1 研究背景

1.1.2 研究意义

1.2中医数据挖掘研究现状

1.3本文主要研究内容及章节安排

1.3.1主要研究内容

1.3.2章节安排

2基于集成学习的中医数据挖掘相关技术

2.1特征选择

2.1.1特征选择定义及过程

2.1.2特征选择要素

2.1.3特征选择算法

2.2数据挖掘

2.2.1 数据挖掘基本概念

2.2.2 数据挖掘过程

2.2.3 数据挖掘工具WEKA

2.3集成学习

2.3.1集成学习定义及理论基础

2.3.2基分类器算法

2.3.3基分类器构造方法

2.3.4基分类器集成方式

2.4本章小结

3.中医病案数据处理

3.1中医病案数据特点

3.2中医哮喘病数据量化

3.3层次聚类特征选择算法改进

3.3.1层次聚类特征选择原理

3.3.2 改进的层次聚类特征选择算法

3.3.3仿真实验

3.4本章小结

4.基于集成学习的中医病案数据挖掘

4.1基于多模态扰动策略的集成学习算法

4.2算法性能分析

4.3基于加权贪心策略的选择性集成学习算法

4.3.1贪心策略

4.3.2选择性集成学习算法

4.4中医哮喘病案辩证分析

4.5本章小结

5总结与展望

参考文献

致 谢

攻读硕士学位期间发表的学术论文

展开▼

摘要

随着计算机科学技术和信息技术的发展,中医药学也顺应潮流逐渐实现信息化和现代化。其中,中医症状-证型的辩证分类技术获得广泛关注并取得相应发展,是当前中医药领域主要的研究课题之一。由于中医病案数据具有复杂性、模糊性和不确定性等问题,使得传统单一的分类挖掘无法确保对所有信息的综合考量。而考虑到集成学习具有较高分类准确率和较好的泛化性能,因此本课题针对合作医院所提供的中医哮喘病病案数据采用集成学习模型进行分类研究,以获得中医哮喘病数据的辨证规律。 首先对中医病案进行量化处理,并根据改进的特征选择算法IHCFS(Improved Hierarchical Clustering Feature Selection Algorithm)获取中医哮喘病的主症状。为了更加客观的描述中医病案症状,对病案症状信息进行分级量化,并采用数据库编程实现自动批量文本数字化处理以用于后续研究;对于中医病案数据特征存在繁多的症状和冗余信息等问题,主要对层次聚类特征选择算法的评价函数以及终止准则进行改进得到IHCFS算法,以更好的剔除冗余信息从而获取哮喘病的主症状。仿真实验证明所获取的主症状更有利于后续辩证分类。然后提出一种基于多模态扰动策略的集成学习算法ELSFS (Ensemble Learning Based on Sampling and Future Selection)用于中医病案的辩证分类。其中利用随机抽样法进行样本空间扰动,利用IHCFS算法进行特征空间扰动以获得差异性更大的基分类器。在UCI数据集上仿真验证,结果显示ELSFS算法具有更好的分类性能。最后考虑基分类器数目过多时所产生的冗余基分类器对模型预测性能的影响,提出一种基于加权贪心策略的选择性集成学习算法SELGS(Selective Ensemble Based on Weighted Greedy Strategy)以减少预测阶段的存储空间、降低运算开销,以提高加快预测速度。通过仿真证明SELGS算法具有更好的辩证分类性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号