基因芯片数据分析方法的比较研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

基因微阵列技术能在一次实验中衡量数以千计的基因的表达强度，是分子生物学和医学一个强有力的工具，可以解决许多重要问题在生命科学领域。基因芯片技术一个主要的应用是寻找样本之间差异表达显著的基因，并在这些差异表达显著的基因的基础之上进行分类，进而希望用较少的基因个数获得较好的分类效果，这对临床诊断、治疗以及对功能基因的研究都有重要的意义。制约基因芯片技术发展的主要问题是缺乏良好的数据分析工具。微阵列数据分析困难有几个原因：1.小样本量及相对大量的基因往往造成同时出现低灵敏度和低特异性的情形。2.基因表达数据是基于传统的统计方法出发，而不是从实际的数据的非线性角度出发。也就是获得的基因表达数据所具有数据量大、维数高、样本量小、非线性的四大特点制约了其进一步发展。广义似然比检验(GLRT)具有对多变量、低表达、非线性数据分析灵敏的特点，其参数为—21gλ，该参数近似的服从X2(1)分布，这样其误差就被有效的控制住；而支持向量机(SVM)能够较好的解决小样本、非线性、高维数、局部极值的问题，已在模式识别、非线性建模等领域得到广泛应用。目的：本研究采用广义似然比检验与支持向量机相结合的方法先提取差异表达显著的基因然后在此基础上进行分类和优化分类。方法：本研究采用的数据集来自于Golub在1999年使用高密度寡核苷酸阵列检测得的急性淋巴细胞白血病(ALL)和急性髓性白血病(AML)两类白血病患者的7129个基因芯片数据。训练集包括38个样本，其中27个是ALL，11个是AML。测试集包括34个样本，其中20个是ALL，14个是AML。以训练集为基础使用广义似然比检验鉴别出差异显著的基因，然后用生物学知识初步验证鉴别的有效性。再在差异显著的基因的基础上构建3种核函数的支持向量机模型、神经网络及Golub的领域分析模型。将训练集和测试集的输入和输出的数据进行归一化后，利用软件Matlab7.0带入以上的模型。采用正确分类的百分率评判预测效果。选一个好的分析模型进行分类优化。结果：通过广义似然比检验鉴别出50个差异显著的基因，用生物学知识验证鉴别得到的基因大都与白血病相关，只有极少的基因的相关文献报导较少。利用多项式SVM、径向基SVM、Sigmoid SVM、神经网络和Golub的领域分析模型对训练集的分类正确率分别为100％、100％、89.5％、94.7％、94.7％，对测试集的分类正确率分别为94.1％、97.1％、88.2％、88.2％、85.3％。选用径向基SVM模型分别对前40、30、20、15、10、8个基因的训练集和测试集分类的正确率分别为100％、94.1％，97.4％、91.2％，97.4％、94.1％，100％、94.1％，97.4％、85.3％，92.1％、85.3％。结论：1.广义似然比检验具有对多变量、低表达、非线性数据分析灵敏的特点，所以本研究用于差异基因的鉴别。其鉴别结果结合白血病分子标志物研究现状分析，与不同类型白血病的关系显著。只有极少的基因的相关文献报导较少，这些基因可能够为鉴别AML和ALL提供一些新的分子标志物。2.支持向量机着重用于解决小样本、非线性、高维数、局部极值的问题，已在模式识别、非线性建模的领域得到广泛应用。本研究的前两种非线性核函数分类器的识别结果基本一致，说明了不同的非线性核函数(Sigmoid函数除外)的支持向量机表现出的性能大致相同，最终采用分类效果最好的径向基SVM。分类优化的结果认为，选取前15个基因的时候分类的效果较好。

著录项

作者
单连峰;
展开▼
作者单位

中国医科大学;

展开▼
授予单位中国医科大学;
学科流行病与卫生统计学
授予学位硕士
导师姓名周宝森;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类肿瘤的预防与控制;其他类型白血病;
关键词
急性白血病; 髓性白血病; 基因芯片数据; 数据分析法;

相似文献

中文文献
外文文献
专利

1. 基因芯片数据分析方法及其在医学中的应用 [J] . 荆志伟 ,王忠 . 中国医药生物技术 . 2010,第006期
2. 基因芯片数据分析方法研究进展 [J] . 荆志伟 ,王忠 ,王永炎 . 生物技术通讯 . 2007,第001期
3. 基因芯片表达数据分析方法研究进展 [J] . 张彦琦 ,李辉智 ,易东 . 重庆医学 . 2005,第012期
4. 基因芯片的应用及其数据分析方法 [J] . 喻红霞 ,胡建达 . 福建医科大学学报 . 2005,第002期
5. 级间分离装置地面爆炸分离试验冲击数据分析方法比较研究 [J] . 邵康 ,王晓森 . 导弹与航天运载技术 . 2021,第004期
6. 基因芯片技术与涂片培养技术对诊断儿童结核病的比较研究 [C] . 邓建军 ,肖国光 . 中华医学会第十八次全国儿科学术会议 . 2013
7. 基因芯片数据分析方法比较 [A] . 单文娟 . 2008

基因芯片数据分析方法的比较研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅