首页> 中文学位 >基于阿尔茨海默病的基因表达数据改进的聚类方法
【6h】

基于阿尔茨海默病的基因表达数据改进的聚类方法

代理获取

目录

声明

摘要

插图和附表清单

1 绪论

1.1 研究背景

1.2 研究现状

1.3 本文研究的目的和意义

1.4 本文的主要工作

1.5 本章小结

2 预备知识

2.1 主成分分析方法

2.2 平面曲线的曲率

2.3 最小二乘估计

2.4 霍普金斯统计量

2.5 聚类介绍

2.6 轮廓系数

2.7 本章小结

3 数据的来源及其特征探究

3.1 数据来源

3.2 特征1:线性相关性

3.3 特征2:类簇性

3.4 本章小结

4 改进的聚类算法

4.1 算法描述

4.2 阈值的选取——曲率最大点

4.3 本章小结

5 实验与结果

5.1 阈值的选取与对比

5.2 聚类质量的评估

5.3 本章小结

6 结论

参考文献

附录

致谢

在校期间发表的科研成果

展开▼

摘要

阿尔茨海默病以其高发病率和无法治愈的特点成为老年人的第四大“健康杀手”。迄今为止,尚不明确阿尔茨海默病的发病机理。随着基因芯片技术的发展,基因表达数据的聚类分析方法应用到阿尔茨海默疾病的研究中。
  为了挖掘阿尔茨海默病的生物信息,本文提出了一种改进的聚类算法。通过实验分析,得到了阿尔茨海默病基因表达数据的特征。当数据呈现出线性相关的特征时,对高维数据进行降维处理并判断聚类趋势,得到数据具有明显的聚类趋势,然后选择用聚类的方法挖掘基因表达数据的潜在信息。但是传统的聚类方法需要事先确定出分类个数,而主观的参数选取难以将大量的数据准确地进行聚类,而且这个参数的选取直接影响了实验数据的分类结果,使得聚类效果缺乏客观性。
  因此,本文提出了将曲率最大处作为分类判据的无监督聚类方法,并且给出了分类判据δ。在基于拟合方法的基础上,找出四种不同患病程度下聚类的阈值和聚类结果。最后得出本文的聚类效果优于其他聚类方法的效果。同时实验结果表明,这种改进的聚类方法较优,并且简捷、具有可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号