首页> 中文学位 >基因芯片数据分析方法比较
【6h】

基因芯片数据分析方法比较

代理获取

摘要

本研究以比较分析基因芯片数据分析方法不同特征为目的,从三个方面进行研究:差异表达基因筛选方法的比较、p值的校正和不同相似性度量方法对聚类分析的影响。 计算机模拟数据分析结果表明所使用的八种差异表达基因筛选方法对均匀和正态分布数据中的差异表达基因有较好的识别作用,而对卡方和指数分布的数据识别效果较差;算法方面,SAM方法和Wilcoxon秩和检验方法比较好。杨树cDNA芯片数据分析结果表明SAM、Samroc和回归模型方法有较多的共同点。 p值校正方法中的Bonferroni法、Holm法和Benjamini & Hochberg假阳性率法过于保守,Permutation方法和Bootstrap方法则能起到减少假阳性率的目的。 通过计算机随机模拟分析八种相似性距离方法对系统聚类和PAM聚类分析产生的影响。在系统聚类分析中,Cubic距离和标准化欧式距离方法要优于马氏距离和欧式距离;在非距离矩阵方法中,Cosine相关系数方法最佳。在PAM聚类分析中,距离矩阵方法的差别不大:非距离矩阵方法(非中心化Pearson相关系数除外)的聚类结果均优于距离矩阵。 基于以上研究结果,我们建议使用SAM、Samroe、Wileoxon秩和检验或回归模型方法筛选差异表达基因:建议使用Permutation方法或Bootstrap方法校正p值;建议使用标准化欧式距离、Cosine相关系数或Pearson相关系数作为聚类分析时的相似性度量方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号