文摘
英文文摘
第1章绪言
1.1研究背景
1.1.1后基因组时代的生物信息学
1.1.2生物数据的特点
1.1.3数据挖掘在生物数据中的应用
1.2国内外的研究现状
1.3本文的贡献
1.4论文结构
第2章蛋白质序列的分类算法研究
2.1引言
2.2挖掘连续频繁模式
2.3裁减频繁模式
2.4利用频繁模式分类
2.5算法复杂性分析和实验结果
2.5.1复杂性分析
2.5.2实验结果
第3章蛋白质序列的聚类算法研究
3.1引言
3.2挖掘频繁模式
3.3裁减频繁模式
3.4建立新特征空间和相似矩阵
3.4.1建立新特征空间
3.4.2建立相似矩阵
3.5聚类计算
3.6算法复杂性分析和实验结果
3.6.1复杂性分析
3.6.2实验结果
第4章基因表达数据的分类算法研究
4.1引言
4.2 P-TREE
4.3基因数据的裁减和离散化
4.3.1基因表达数据
4.3.2裁减基因数据
4.3.3离散基因表达数据
4.4基于P-TREE的多决策树分类
4.5算法复杂性分析和实验结果
4.5.1复杂性分析
4.5.2实验结果
第5章基因表达数据的聚类算法研究
5.1引言
5.2基于KNN密度聚类基本思想
5.3并行算法思想
5.4用DCOM实现并行算法
5.4.1 DCOM组件基本原理
5.4.2并行算法的DCOM的实现
5.5算法复杂性分析和实验结果
5.5.1复杂性分析
5.5.2实验结果
结论
攻读硕士学位期间发表的论文
致谢
参考文献
独创性声明和学位论文版权使用授权书