声明
致谢
1 引言
1.1 研究背景
1.2 国内外研究现状
1.3 研究内容
1.4 论文结构
2 相关理论概述
2.1 疾病预测原理
2.2预测系统评估指标
2.3 医疗数据的预处理技术
2.3.1 基于规则的数据清洗
2.3.2 基于工具的中文分词技术
2.3.3 关键字提取
2.4 推荐算法综述
2.4.1 基于人口统计学的推荐算法
2.4.2 基于内容的推荐算法
2.4.3 基于记忆的协同过滤推荐算法
2.4.4 混合推荐算法
2.5 本章小结
3 基于大数据的混合协同过滤推荐算法研究
3.1 问题描述与分析
3.2 数学定义
3.3 医疗数据集获取
3.4 基于大数据的混合推荐算法
3.4.1 建立疾病-关键字对应关系
3.4.2 构建用户-疾病间接相关性矩阵
3.4.3 基于大数据的用户-疾病相关性矩阵优化
3.2.1 章节在大数据下取排名靠前的词作为已知疾病对应的关键词,在维度确定的情况下,排名的倒叙值作为权重值Pki如图3-10所示:
3.4.4 算法总结
3.3章节介绍了基于大数据的混合协同过滤推荐算法,算法的流程如图3-12所示:
3.5 实验与分析
3.5.1 实验准备
3.5.2 算法比较
3.5.3 参数设置
3.5.4 结果比较
3.6 本章小结
4 疾病预测系统搭建
4.1 系统搭建准备
4.1.1 实验环境
4.2 预测系统搭建与性能分析
4.2.1 数据采集层搭建
4.2.2 数据存储设计
4.2.3 Hadoop分布式环境搭建
4.2.4 应用集成
4.2.5 性能分析
4.3 本章小结
5 总结与展望
5.1 总结
5.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
独创性声明
学位论文数据集
北京交通大学;