声明
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 使用已有序列比对工具进行脱靶位点预测
1.2.2 使用专门设计的算法进行脱靶位点预测
1.3 项目来源及研究内容
1.4 论文结构
2 相关概念、算法及技术介绍
2.1 CRISPR/Cas9系统
2.2 Burrows-Wheeler变换及后缀数组
2.3 FM-index算法
2.4 Spark分布式计算框架
2.5 本章小结
3 基于Spark的CRISPR系统脱靶位点预测算法
3.1 CRISPR系统脱靶位点预测问题描述及分析
3.2 对参考基因组序列生成FM-index索引文件
3.2.1 C表的求解
3.2.2 O表的求解及压缩
3.2.3 后缀数组的求解及压缩
3.3 CRISPR系统脱靶位点预测算法的设计与实现
3.3.1 基于FM-index算法的部分模糊匹配
3.3.2 优化搜索树的遍历
3.3.3 预测结果的校验策略
3.4 基于Spark的算法并行化处理
3.4.1 使用MapReduce编程模型并行化
3.4.2 基于Spark的具体实现
3.5 本章小结
4 算法性能测试与结果分析
4.1 测试数据及环境
4.2 Spark-OFFinder单机性能测试与分析
4.3 Spark-OFFinder集群性能测试与分析
4.3.1 参考基因组序列长度对算法影响的测试与分析
4.3.2 sgRNA序列数量对算法影响的测试与分析
4.3.3 最大允许错配数对算法影响的测试与分析
4.3.4 算法拓展性测试
4.4 本章小结
5 总结与展望
5.1 本文工作总结
5.2 未来工作展望
致谢
参考文献