首页> 中文学位 >基于OpenMP的启动子数据分析系统的设计与实现
【6h】

基于OpenMP的启动子数据分析系统的设计与实现

代理获取

目录

摘要

第1章 绪论

1.1 课题的研究背景、目的及意义

1.2 课题的研究现状及发展趋势

1.3 课题的应用前景及学术价值

1.4 相关技术

1.4.1 多核

1.4.2 OpenMP技术

1.5 本文研究内容

1.6 本章小结

第2章 系统的总体设计

2.1 系统的需求分析

2.2 系统的流程设计

2.3 系统的模块设计

2.3.1 定位模块的设计

2.3.2 过滤的模块设计

2.3.3 共享分析及基因本体论分析的模块设计

2.4 系统开发的硬件配置信息

2.5 本章小节

第3章 Motif定位

3.1 Motif定位算法的设计

3.2 Motif定位算法的实现

3.3 Motif定位的并行算法设计

3.4 Motif定位的并行算法实现

3.5 串/并行算法的时间对比

3.6 本章小节

第4章 频繁调控元件过滤

4.1 对Motif的百分比值进行求解

4.1.1 打乱算法的设计

4.1.2 打乱算法的实现

4.1.3 串/并行算法的执行时间对比

4.2 过滤频繁控制元件

4.2.1 并行算法描述

4.2.2 串/并行算法的实验结果对比

4.3 计算过程中的优化

4.3.1 素数拆分算法的原理

4.3.2 拆分算法在本章中的应用

4.3.3 优化后的结果分析

4.4 共享处理

4.5 本章小结

第5章 系统实现及应用

5.1 启动子数据分析系统的实现

5.2 系统应用

5.2.1 基因本体论

5.2.2 基因功能注释

5.3 本章小结

结论

参考文献

攻读硕士学位期间发表的学术论文及参加的科研项目

致谢

声明

展开▼

摘要

本文对启动子基因数据进行分析及处理,设计并实现了一个基于OpenMP的启动子数据分析系统,针对大豆的植物启动子序列进行分析。
  首先,截取不同植物启动子基因上游1KB区域的序列作为实验数据,与固定的469个Motif元件进行定位工作。标识出这469个调控元件在1KB启动子序列中的匹配次数及匹配位置。在匹配过程中,根据需求将匹配结果进行相应去重,利用现有软件进行频繁模式挖掘处理。其次,对频繁械挖掘的结果文件进行P值计算,采用素数拆分算法,提高了P值的计算精度。将频繁调控元件组合文件以0.05/C(469,m)为标准进行过滤,保留有效的频繁组合数据。最后,对异类植物启动子序列经处理之后的各自频繁组合文件进行共享分析及处理,得到异类植物之间的共享频繁调控元件,再进行GO功能注释,从注释结果中确定异类植物之间的启动子序列所存在的相互关系,同时确定是否存在对基因起调控作用的序列,进而为后续基因研究工作提供参考数据。
  在系统的实现过程中,由于基因数据量很大,所以根据系统的各个模块任务,分析大批量的启动子序列之间的关系及多层循环之间的相互联系,从而采用OpenMP技术将没有关联的任务进行并行处理。最终,本文将各部分串行算法所需要的执行时间与对应的并行算法时间进行了逐一对比,实验结果表明,应用并行技术之后,明显提高了启动子数据分析系统的效率。这种高效地处理方式对基因的后续研究工作具有重要的现实意义。

著录项

  • 作者

    石燕;

  • 作者单位

    黑龙江大学;

  • 授予单位 黑龙江大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 陆军;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.52;
  • 关键词

    启动子; 数据分析系统; 软件设计; OpenMP技术;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号