首页> 中文学位 >基于云计算的食源性疾病预测分析方法的研究
【6h】

基于云计算的食源性疾病预测分析方法的研究

代理获取

目录

声明

第1章 绪论

1.1 研究背景和意义

1.2 国内外现状研究

1.3 主要研究内容

1.4 论文的组织结构

1.5 本章小结

第2章 理论基础与相关技术

2.1 云计算与Spark

2.2 数据挖掘技术

2.3 数据可视化

2.4 食源性疾病监测

2.5 本章小结

第3章 食源性疾病预测分析算法Spark-IRF

3.1 Spark-IRF算法的设计

3.2 Spark-IRF算法性能分析

3.3 本章小结

第4章 食源性疾病数据聚类可视分析方法WIK-means

4.1 WIK-means聚类算法

4.2 WIK-means算法的性能分析

4.3 本章小结

第5章 FASBSFD原型系统的设计与实现

5.1 FASBSFD系统需求分析

5.2 FASBSFD系统设计

5.3 FASBSFD系统实现

5.4 本章小结

第6章 结论与展望

6.1 工作总结

6.2 展望

参考文献

致谢

攻读学位期间参加的科研项目和成果

展开▼

摘要

近些年频频发生的食源性疾病事件,使得人们越来越关注食源性疾病问题。如今,食源性疾病已经成为世界各国重点关注的事件之一,人们在日常生活中通过饮食的各方面极有可能导致食源性疾病。且从研究现状来看,食源性疾病的安全意识和相关的食源性监测系统还没有形成规范化的管理与监督,食源性疾病预测分析中仍然存在数据挖掘技术效率不高和可视化技术效果不明显等问题。针对上述问题,本文对食源性疾病预测分析方法的研究,主要从以下三个方面展开:
  首先本文提出了Random Forests预测分析算法(Spark-IRF, Improved Random Forests algorithm based on Spark),该算法主要是从降维和权重投票方法两个部分来改进DRF(Dynamic Random Forests)算法。接着从准确率和召回率两个方面对实验数据分析,结果显示 Spark-IRF算法在准确率和召回率上相比 DRF算法、Spark-MLRF(Spark Machine Learning Random Forests)算法有明显的提高。
  其次提出了聚类可视分析算法 WIK-means(the Weighted Intelligent K-means Algorithm),解决IK-means(Intelligent K-means)算法中存在的问题,即IK-means算法在计算数据点到质心之间的距离时,同等地对待每一个特征变量属性,可能会使得距离较远或者同等重要的两个相关属性被分配到不同的簇中,而导致数据结果失真。WIK-means算法在计算距离的过程中,对每个特征属性赋予相应的权重值来计算误差平方和的最小值。最后通过不同的聚类中心点不同的迭代次数,对 K-means算法 IK-means算法WK-means(Weighted K-means)算法DBScan算法、K-SCP算法和WIK-means算法进行分析,结果表明我们提出的WIK-means算法在时间效率和准确率方面都具有相对明显的优势。
  最后本文设计并实现了基于Spark的食源性疾病预测分析系统FASBSFD(Forecasting and Analysis System Based on Spark for Foodborne Diseases)。在该系统中,食源性疾病预测分析方法采用了Spark-IRF预测分析算法及WIK-means算法进行聚类可视化展示,最后通过食源性疾病数据验证表明该系统是可行有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号