首页> 中文学位 >基于Hana的医疗大数据多维度挖掘
【6h】

基于Hana的医疗大数据多维度挖掘

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 研究背景

1.2 研究现状

1.3 研究内容

1.4 论文结构

2 相关技术介绍

2.1 数据挖掘的概念

2.2 数据挖掘的过程

2.3 系统涉及的关键技术

2.4 系统实现的难点

2.5 本章小结

3 系统分析与设计

3.1 可行性分析

3.2 需求分析

3.3 系统开发环境

3.4 系统的整体框架设计

3.5 概要设计

3.6 本章小结

4 OLAP系统实现

4.1 数据建模

4.2 主要的数据表结构

4.3 视图集成

4.4 PAL算法的实现

4.5 BO平台对外提供查询

4.6 本章小结

5 多病种临床数据分析

5.1 甲亢临床数据分析

5.2 糖尿病临床数据分析

5.3 本章小结

6 多病种多维度数据挖掘

6.1 多维度数据挖掘

6.2 关联规则算法在Hana上实现

6.3 聚类算法在Hana上实现

6.4 关联规则算法在甲亢数据上的应用

6.5 关联规则算法在糖尿病数据上的应用

6.6 聚类算法在甲亢数据上的应用

6.7 数据挖掘带来的医疗隐私问题

6.8 本章小结

7 总结与展望

7.1 课题总结

7.2 课题展望

致谢

参考文献

攻读学位期间的研究成果目录

展开▼

摘要

随着人口老龄化问题日趋严重,我国的医疗费用占GDP比重的提升,以及医疗大数据领域将产生万亿市场价值等多因素的带动下,医学领域已经开始拥抱医疗大数据,并将其应用于医学研究、医学临床以及医学管理等各方面的实践。医疗机构对患者进行诊断和治疗过程中产生的数据统称为医疗数据,包括患者个人信息、就诊记录、医疗报告、医学影像数据和检验指标数据等。以上海瑞金医院来为例,日均需要接待上万人次的患者前来就诊,这么多数据汇集在一起,成年累月的增长量非常考验该医院数据库容量的存储能力。在长时间内进行有效的数据管理外,对这些医疗大数据进行数据挖掘使其能够帮助医院进行运营决策则是一个值得研究的课题。
  医疗行业在走向信息电子化的过程中就已经遇到了海量数据和非结构化数据的挑战,特别是近年来“大数据”概念的盛行,大公司们提出了很多关于医疗大数据的解决方案。针对这种情况,开展医疗大数据相关研究工作对医院的信息化发展是有着重要意义的。本课题基于Hana平台,结合对联机分析处理系统(OLAP)的研究,设计了一套用于支持多维度复杂查询的可视化系统,并在多维度数据集的基础上进行相关的数据挖掘工作,从而找到患者临床医疗大数据间潜在的未知知识。
  本文首先对上海瑞金医院在线应用系统中产生的临床数据进行预处理,给出了多张数据表的业务说明以及关联关系,并阐述了临床医疗数据的OLAP模型。在此基础上,本文通过分析系统的可行性与功能需求,从而设计了临床医疗数据的多维度可视化系统,分别介绍了系统中的四个主要的模块:数据预处理模块、数据建模模块、数据挖掘算法模块以及数据可视化模块。
  针对多病种情况,本文进行专门的数据分析。根据甲亢患者重要指标的检验情况,可以将甲亢患者治疗过程分成四个阶段:临床缓解阶段、生化缓解阶段、免疫缓解阶段以及免疫治愈阶段,而且每个阶段都可以出现治疗复燃情况。通过对不同阶段的患者数据进行分析,可以统计得出甲亢患者在不同阶段的治愈率。而糖尿病属于长期高血糖症状,检测指标众多,但往往多对指标组合存在强相关性。所以通过对糖尿病患者指标检验数据的分析,可以得到某对指标的潜在关系,从而为合理减少患者的多余检验检测提供了数据支持。
  最后,为了验证数据分析结果的有效性,本文还使用多种挖掘算法(关联规则算法、聚类分类算法等)对患者的检验报告、检验指标以及用药情况等数据等进行挖掘,通过对比而得出一些辅助性的医疗结论,这些结论可以为将来疾病的病因起源分析提供一定的理论支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号