首页> 中文学位 >运用三种方法挖掘疾病关联的研究:电子病历中疾病诊断数据的应用
【6h】

运用三种方法挖掘疾病关联的研究:电子病历中疾病诊断数据的应用

代理获取

目录

声明

摘要

英文缩略语

1 前言

2 资料来源与研究方法

3 结果

4 讨论

5 结论

本研究创新性的自我评价

参考文献

附录

综述 临床数据挖掘方面的研究进展

在学期间科研成绩

致谢

个人简介

展开▼

摘要

目的:数据挖掘方法是发现数据中隐含知识的常用方法。本研究目的在于探索运用关联规则挖掘、系统聚类分析、网络分析三种数据挖掘方法挖掘电子病历中疾病诊断数据里存在的疾病间潜在关联并了解这三种方法在表现疾病间关联时功能上的异同。
  方法:本课题收集沈阳市某医院电子病历数据库中2008年7月至2014年11月期间的11812名儿科病房住院患者的15710次患者诊次记录并进行数据预处理。以每患者诊次为基本分析单元,统计样本数据中疾病诊断编码(ICD)的出现频率,根据预设阈值截取得到出现频率较高的ICD编码,进而构建“患者诊次号-高出现频率ICD编码”矩阵。随后应用Apriori算法理念、重复二分法、寻径网络算法分别开展疾病的关联规则挖掘、系统聚类分析和网络分析以获取疾病间关联。并通过查阅教科书和科技文献,对所得疾病间关联进行验证。
  结果:本研究结果如下:(1)应用关联规则挖掘从样本数据中得到47条存在于3-频繁项集中的疾病间强关联规则,其中31条疾病关联规则具有明确文献支持,其余16条为“非特异性并发”关联。(2)系统聚类分析则将74种疾病(出现频率范围为0.46%~11.52%)划分为21个类团,其中包含5个孤立疾病。其余16个类团中,14个疾病类团具有明确文献支持,另外2个类团尚待验证。(3)网络分析则将74种疾病构建出13条明确文献支持的疾病关联路径。
  结论:通过运用三种数据挖掘方法挖掘疾病间关联并对其进行文献验证后发现多数疾病关联与原有知识和经验相吻合,同时也发现一些潜在疾病间关联并有待验证。通过对三种疾病关联结果进行分析和比较,了解和认识到三种数据挖掘方法存在相似性和差异。首先,三者均能在一定程度上形象化地表现出疾病间存在的关联并有利于认识疾病的发生发展;但三者均不能体现具有关联的疾病间的时序性。其次,相对关联规则挖掘而言,系统聚类分析和网络分析在一定程度上高估了间接联系的疾病间的关联;且关联规则挖掘更关注疾病集的局部共现性,而系统聚类分析和网络分析则更注重疾病与纳入研究的其它所有疾病的整体相互关系;而相对系统聚类分析而言,关联规则挖掘和网络分析的结果更接近实际。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号