首页> 中文学位 >模糊聚类在基因表达数据分析中的应用研究
【6h】

模糊聚类在基因表达数据分析中的应用研究

代理获取

目录

文摘

英文文摘

声明

1绪论

1.1课题背景

1.1.1生物信息学简介

1.1.2抑郁症简介

1.1.3基因芯片简介

1.1.4本课题研究意义

1.2国内外研究现状

1.3本文的主要研究工作和贡献

1.3.1课题来源

1.3.2本文的主要贡献

1.4本文的组织结构

2基因表达数据采集及预处理

2.1基因芯片数据采集简介

2.2数据预处理技术

2.2.1数据清洗

2.2.2数据集成

2.2.3数据归约

2.2.4数据变换与筛选

2.3基因表达数据的预处理

2.3.1基因表达数据的存储

2.3.2基因表达数据的清洗

2.3.3基因表达数据的归约

2.3.4基因表达数据的变换与筛选

2.4本章小结

3模糊聚类分析

3.1聚类分析概述

3.2传统聚类的常用方法

3.2.1谱系聚类法

3.2.2基于等价关系的聚类法

3.2.3基于图论的聚类法

3.3基于目标函数的模糊聚类分析

3.3.1数据集的模糊C划分

3.3.2模糊聚类目标函数

3.3.3模糊C均值聚类

3.4基于目标函数的基因表达数据聚类

3.5本章小结

4模糊聚类有效性判断

4.1聚类有效性分析概述

4.1.1基于模糊集划分的聚类有效性判别函数

4.1.2基于数据集统计信息的聚类有效性判别函数

4.1.3基于数据集几何结构的聚类有效性判别函数

4.2基因表达数据聚类有效性判断

4.3本章小结

5基因表达数据模糊聚类系统设计与测试

5.1系统总体设计

5.2数据库设计

5.3系统初始化

5.4数据预处理方法设计

5.5模糊聚类算法设计

5.6挖掘结果可视化

5.7测试结果

5.8本章小结

结论

致谢

参考文献

攻读硕士学位期间发表的学术论文及研究成果

展开▼

摘要

基因表达数据分析是当前国际生物信息科学研究的热点。针对基因表达数据的海量性和已知功能基因少量性的特点,采用不需要先验知识的聚类方法,能够直接将具有相似表达水平的基因聚在一起,是分析基因功能的有效途径。 本文根据四川省医学科学院动物研究所提供的大鼠抑郁症基因芯片生物实验数据的特性对其进行数据挖掘分析,主要内容包括: 第一,根据芯片上看家基因的表达值对其它表达值进行标准化,使来自不同批次实验的同一基因的表达数据在量纲上达成统一;根据基因表达数据的生物意义对其进行降维,不仅减少了数据量,而且保持了数据集的完整性。 第二,把大鼠同一基因在其不同病理状态下表达值的比值作为数据挖掘的输入数据,可快速找出变化相似的基因,使挖掘结果能更好反映基因的生物学意义。 第三,采用改进的FCM算法和xie—Beni指数相结合的方法作为基因表达数据的挖掘算法,不仅对基因样本类属的不确定性进行了描述,而且避免了无根据确定聚类数的盲目性。 第四,针对基因表达数据分析和模糊聚类的特点对挖掘结果进行可视化描述,使复杂结果简单化。 经过测试,上述研究达到了从数据中提取具有生物学意义的抑郁症相关基因分类结果和测试新药疗效的目的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号