首页> 中文学位 >基于模拟退火粒子群优化技术的基因数据双聚类算法研究
【6h】

基于模拟退火粒子群优化技术的基因数据双聚类算法研究

代理获取

目录

文摘

英文文摘

声明

第1 章 绪论

第2 章 双聚类概述

第3 章 传统聚类在双聚类中的应用

第4 章 Cheng and Church 算法的改进与实现

第5 章 基于改进的模拟退火法在双聚类算法中应用

第6 章 总结与展望

参考文献

附 录

致 谢

展开▼

摘要

基因数据双聚类是基因表达数据矩阵中的子矩阵,用来表达矩阵中部分行与列的相互表达水平。双聚类算法则是在数据矩阵的行和列两个方向上同时聚类,以找到数据矩阵中具有较高相关性的行子集和列子集,其中子矩阵中的行和列分别代表基因表达数据中的基因子集和条件子集。
   本文根据当前双聚类的现状提出了两个算法。第一个算法是在Cheng andChurch算法的基础上进行改进和实现的快速算法。首先对基因表达数据的基因集合和条件集合分别使用k-均值和层次聚类生成n行和m列子集,将行子集和列子集组合成n*m数据子矩阵,并计算每个数据子矩阵的均方残值,取前100个数据子矩阵作为双聚类的初始种子。然后采用自低向上策略对种子分别添加行和列,在添加行和列的过程中定义两个参数行增长率和列增长率,用来加快种子的增长速度,并找出具有最低均方残值的双聚类。最后数据测试采用Cheng andChurch使用的两个数据集酵母细胞数据集和人体瘤细胞数据集,并将算法的结果与Cheng and Church等算法的结果进行比较,改进后的快速算法,在双聚类质量变化不多的条件下,运行时间减少一半左右。
   本文提出的另一个算法是模拟退火粒子群优化的混合优化算法,该算法以模拟退火法为框架结合粒子群优化算法,避免了模拟退火的概率突跳性缺点。算法同样采用自低向上策略,首先生成双聚类种子,然后采用模拟退火粒子群算法添加种子的行和列,找出最优结果。最后数据测试同样采用Cheng and Church使用的两个数据集酵母细胞数据集和人体瘤细胞数据集,聚类结果与其他算法结果进行比较。实验结果表明,在时间消耗增加不多的情况下,双聚类的质量总排名不低于第三位,效果令人满意。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号