基于基因表达谱的肿瘤分类特征基因选择研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

基因芯片技术因其能同时快速测量成千上万条基因的表达水平,被广泛地应用于基因组层次上研究细胞的基因表达模式。随着微阵列技术广泛运用到肿瘤疾病研究中,产生了大量维数高、样本少的肿瘤基因表达谱数据。如何从海量的基因表达谱数据中发现和提取少量的具有分类识别能力且最小的冗余度的特征基因,挖掘出有用的信息和知识,更加全面的认识肿瘤的基因本质、获得对“肿瘤-基因”间关系的真实反映,对推进肿瘤学的基础研究和肿瘤的临床诊断与治疗,进一步研究肿瘤、发现肿瘤的致病机理是至关重要的作用。本文的主要研究是针对肿瘤基因表达谱的肿瘤分类特征基因选择,取得了如下的成果： 1.根据肿瘤微阵列数据的特点,提出了一种基于相关性改进的SVM-RFE算法。算法引入相关性的评价基因的相互之间的关系,在寻求数据最小冗余的同时,考虑了如何提高特征选择的速度。在白血病微阵列数据集实验中证明,新方法在没有降低分类精度的情况下大大改进了标准SVM-RFE算法效率。 2.由于传统了K-均值算法需要人为设置的聚类数量,然后再对基因表达谱数据进行聚类,而现实中基因表达谱数据的最佳聚类的数量是未知的。在本文中,我们利用数据内在的统计特性对传统的K-均值算法进行改进了,提出了启发式K-均值聚类算法,能根据基因表达谱数据内在的统计特性自我调整聚类的数量,得到比较好的聚类结果。实验结果表明该算法能根据基因表达谱的相似性把基因表达谱数据集分成次最佳的类数。 3.在基因表达谱的特征基因选取中,如果选择单纯使用Filter算法或Wrapper算法具有明显的缺陷:Filter方法选取的特征具有高冗余性、分类精度低；Wrapper方法计算复杂度高。为了结合Filter、Wrapper和聚类算法的优点,本文提出了一种新颖的混合特征基因选择方法,Filter Clustering SVM-RFE方法。该算法参数设置方便,无须搜索,运行速度快,也不必事先指定精确的聚类数量(像常用的聚类算法那样)。在白血病和结肠癌数据集的分类特征基因选择实验中获得了很好的效果。

著录项

作者
段艳华;
展开▼
作者单位

北京工业大学;

展开▼
授予单位北京工业大学;
学科模式识别与智能系统
授予学位硕士
导师姓名李建更;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类生物信息、生物控制;其他;
关键词
基因芯片; 基因表达谱; 生物信息学; 肿瘤分类; K-均值聚类算法;

相似文献

中文文献
外文文献
专利

1. 模糊K-NN算法在基于基因表达谱的肿瘤分类中的应用 [J] . 陈智勤 . 计算机应用与软件 . 2010,第009期
2. 基于子模性质的基因表达谱特征基因提取 [J] . 蒋智谋 ,姚唐龙 . 电脑知识与技术 . 2015,第017期
3. 基于一种混合法的胃癌基因表达谱分类特征基因选取 [J] . 李建更 ,李萍 ,阮晓钢 . 北京工业大学学报 . 2010,第001期
4. 基于基因表达谱胃癌特征基因选取研究 [J] . 黄成玉 ,阮晓钢 ,李建更 . 微计算机信息 . 2009,第004期
5. 基于基因表达谱的结肠癌特征基因选取 [J] . 刘全金 ,李颖新 ,阮晓钢 . 昆明理工大学学报：理工版 . 2006,第1期
6. 基于基因表达谱的肿瘤分类研究进展 [C] . 王树林 ,陈火旺 ,王戟 . 2006年中国科学院智能计算与生物信息学学术研讨会 . 2006
7. 基于基因表达谱数据的肿瘤分类算法研究 [A] . 余东海 . 2016

基于基因表达谱的肿瘤分类特征基因选择研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅