首页> 中文学位 >基因表达谱数据的特征基因提取和分类方法的研究
【6h】

基因表达谱数据的特征基因提取和分类方法的研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景和意义

1.2 基因芯片

1.2.1 基因芯片

1.2.2 基因芯片的应用和研究方向

1.3 基因表达谱数据分析的研究现状

1.4 本文研究内容与组织结构

第二章 基因表达谱数据分析理论基础

2.1 基因表达谱数据的数学描述

2.2 基因表达谱数据集

2.3 基因表达谱数据的特点

2.4 基因表达谱数据的预处理

2.5 本章小结

第三章 基于邻域不定性信息和记分准则提取肿瘤特征基因

3.1 多种记分准则

3.2 邻域不定性信息

3.3 特征基因提取

3.4 K-近邻分类器

3.5 实验

3.5.1 数据集

3.5.2 实验方法

3.5.3 实验结果与分析

3.6 本章小结

第四章 基于随机游走的肿瘤基因表达谱数据分类

4.1 邻接矩阵和高斯加权Laplace矩阵

4.1.1 邻接矩阵

4.1.2 高斯加权Laplace矩阵

4.2 随机游走分类方法的理论研究

4.2.1 随机游走模型

4.2.2 联合狄利克雷(Dirichlet)问题

4.3 实验

4.3.1 数据集

4.3.2 实验方法

4.3.3 实验结果与分析

4.4 本章小结

第五章 总结与展望

5.1 论文总结

5.2 研究展望

参考文献

致谢

攻读硕士学位期间发表的论文及参加的科研项目

展开▼

摘要

DNA微阵列技术的高速发展,使得能够在一张微型的芯片上同一时间监测数以万计的基因在同一条件下的基因表达水平,它不但有利于判定肿瘤组织的类别及其新亚型的发现,而且为肿瘤分子生物学方面的研究提供了可靠的科学依据。随着技术和实验仪器的不断发展,产生了大量基因表达谱数据,通过研究分子水平上肿瘤的发生发展机制,定位肿瘤相关基因、揭示肿瘤基因间的调控关系从而为肿瘤的诊断和治疗开辟一条新的途径。
  本文基于肿瘤基因表达谱数据进行了特征基因提取和分类方法的初步研究,且分析了对应的实验结果。主要内容如下:
  1.针对基因表达谱数据中奇异值对样本一阶信息和二阶信息的影响,提出了一种基于邻域不定性信息和记分准则的肿瘤特征基因的提取方法,首先,利用基因表达谱数据样本点集的邻域不定性信息找出最具代表性的样本点基因表达值;然后,把该样本点及其周边邻近点的基因表达值看作下一步分析的对象,结合记分准则提取肿瘤特征基因子集;最后,使用KNN分类器对待测样本进行分类实验。实验采用了利用DNA微阵列获取的两组真实数据,实验结果显示了本章方法相比于只用传统记分准则选取的信息基因,在可靠性上有明显的提高。
  2.将随机游走算法应用于肿瘤基因表达谱数据的分类,首先,将基因表达谱数据样本映射为高维空间中的一个点,以点集为基础进行构图,求解点与点之间的邻接矩阵,进而求得Laplace矩阵;然后,利用联合狄利克雷求解随机游走的转移概率;最后,根据取转移概率最大值的判断基因表达谱数据的分类,实验结果显示了该方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号