摘要
第一章 绪论
1.1.选题背景和意义
1.1.1.生物信息学
1.1.2.DNA序列数据的管理
1.1.3.DNA序列比对
1.2.项目背景
1.3.论文研究内容
1.4.本文组织结构
第二章 基本知识与相关术语
2.1.DNA
2.1.1.DNA概念
2.1.2.DNA序列数据特性
2.2.基本术语
2.3.DNA序列比对
2.3.1.比对的概念
2.3.2.比对工具
2.3.3.比对结果的存储格式
第三章 相关研究与产品
3.1.DNA序列压缩算法
3.1.1.压缩算法概述
3.1.2.压缩算法分类
3.1.3.典型压缩算法
3.2.相关产品
3.2.1.SAMtools的概况
3.2.2.SAMTools的典型命令
第四章 功能模块解析
4.1.软件体系结构
4.2.文件输入模块
4.3.基于位点的存储模块
4.3.1.存储的基本思想
4.3.2.Read重编码
4.3.3.表头索引机制
4.4.区间合并压缩模块
4.4.1.区间合并的主要思路
4.4.2.确定ACGT顺序的种类
4.4.3.压缩过程
4.4.4.目标文件格式
4.4.5.压缩后的随机访问
4.4.6.存储空间对比
4.5.字母长度压缩模块
4.5.1.字母长度压缩的主要思路
4.5.2.字母长度压缩的优点
4.5.3.压缩过程
4.5.4.目标文件格式
4.5.5.压缩后的随机访问
4.5.6.存储空间对比
4.6.存储结果显示模块
第五章 软件操作方式及实验结果介绍
5.1.软件运行环境
5.1.1.介绍
5.1.2.安装配置
5.2.界面介绍
5.2.1.文件输入
5.2.2.基于位点的存储
5.2.3.压缩
5.2.4.存储结果
第六章 结束语
6.1.总结
6.2.展望
参考文献
致谢
声明
复旦大学;