首页> 中文学位 >MeRIP-Seq高通测序数据的关键生物信息学方法研究
【6h】

MeRIP-Seq高通测序数据的关键生物信息学方法研究

代理获取

目录

第一个书签之前

摘 要

Abstract

目 录

Contents

图清单

表清单

1 绪论

1 Introduction

1.1 课题研究背景及意义(Research Background and Significance of the Study)

1.2 国内外研究现状(Current Research Status at Home and Abroad)

1.2.1 RNA修饰数据库研究现状

1.2.2 聚类算法的研究现状

1.3 课题研究内容与创新(Content and Innovation of the Subject)

1.3.1 建立了RNA m6A甲基化修饰数据库MeT-DB V2.0

1.3.2 层次聚类算法的研究与改进

1.3.3 基于Dirichlet过程贝塔二项式混合模型的聚类算法

1.4 论文结构(Structure of the Thesis)

2 MeRIP-Seq测序数据分析综述

2 Reviews of MeRIP-Seq Sequencing Data Analysis

2.1 MeRIP-Seq的技术原理(Principle of MeRIP-Seq Technique)

2.2 MeRIP-Seq高通测序数据的处理流程(Procedure of Processing MeRIP-Seq High Throughput Sequencing Data)

2.2.1 读段映射

2.2.2 位点预测

2.2.3 差异甲基化分析

2.3 聚类算法综述(Overview of Clustering Algorithm)

2.3.1 基于分层的聚类算法

2.3.2 基于划分的聚类算法

2.3.3 基于密度的聚类算法

2.4 聚类分析中的相似性度量方法(Similarity Measurements in Clustering Analysis)

2.5 本章小结(Summary)

3 MeT-DB V2.0的设计与实现

3 Design and Implementation of MeT-DB V2.0

3.1.1 需求分析

3.1.2 结构设计

3.1.3 总体设计

3.2 数据库设计(Design of Database)

3.2.1 数据库的技术选择

3.2.2 数据库的概念结构设计

3.2.3 数据库的逻辑结构设计

3.2.4 数据库的物理结构设计

3.3.1 基因组浏览器的技术选择

3.3.2 基因组浏览器的基本文件配置

3.3.3 基因组浏览器的基因数据导入

3.4.4 基因组浏览器的基因显示页面

3.4 网页设计与功能实现(Webpage Design and Function Implementation)

3.4.1 网页的总体设计

3.4.2 网页开发的技术选择

3.4.3 统计数据表的功能实现

3.4.4 表格展示的功能实现

3.4.5 查询搜索的功能实现

3.4.6 表格信息高级筛选的功能实现

3.4.6 关联性数据跳转的功能实现

3.4.7 网页分析工具的功能实现

3.5 本章小结(Summary)

4 层次聚类算法研究与改进

4 Hierarchical Clustering Algorithm Research and Improvement

4.2 层次聚类算法的分析(Analysis of Hierarchical Clustering Algorithm)

4.3 基于属性权重的层次聚类算法(Hierarchical Clustering Algorithm Based on Weighting Strategy)

4.3.1 算法思想

4.3.2 算法实现

4.4 仿真数据分析(Test on Simulated Data)

4.4.1 性能评估标准

4.4.2 仿真结果

4.5 真实数据分析(Test on Real Data)

4.6 本章小结(Summary)

5 基于Dirichlet过程贝塔二项式混合模型的聚类算法

5 Dirichlet Process Beta-binomial Mixture Model Based Clustering

5.1 DPBBM模型(DPBBM Model)

5.2 参数推断(Parameter inference)

5.2.1 Φk的推断

5.2.2 cg的推断

5.2.3 τ的推断

5.3 仿真数据分析(Test on Simulated Data)

5.3.1 性能评估标准

5.3.2 仿真结果

5.4 真实数据分析(Test on Real Data)

5.5 本章小结(Summary)

6 总结与展望

6 Summary and Prospect

6.1 总结(Summary)

6.2 展望(Prospect)

参考文献

作者简介

学位论文原创性声明

学位论文数据集

展开▼

摘要

RNA甲基化修饰,特别是6-甲基腺嘌呤(m6A)的相关研究,开启了RNA生物学研究的新篇章。m6A甲基化指的是发生在碱基A第六位N原子上的甲基化,是最常见的一种RNA转录后修饰形式。MeRIP-Seq作为一种结合了免疫共沉淀方法的高通量测序技术,使得在全转录组范围内研究 m6A 甲基化相关特性成为可能。然而,随之而来的海量数据的分析及处理工作尚不够充分。因此,本文针对 MeRIP-Seq 测序数据,建立并完善相关信息数据库,同时设计了两种聚类算法实现其聚类分析。主要研究内容如下: 针对RNA m6A甲基化实验信息数据库不完善的问题,本文建立了MeT-DB V2.0。和首个收集转录组m6A甲基化修饰的实验信息数据平台MeT-DB相比,MeT-DB V2.0不仅拥有7个物种26个实验预测的m6A峰信息和单碱基位点信息,还集成了1个甲基化酶靶位点信息数据库和6个功能性相关数据库。此外,MeT-DB V2.0首次提供Guitar Plot和m6A-Driver两个基于网页的MeRIP-Seq数据分析工具。在网页设计方面,MeT-DB V2.0采用了PHP、MySQL等网站开发技术和 JBrowse 基因组浏览器,基因信息的查询、搜索和浏览更加快速方便。MeT-DB V2.0的建立不但完善了RNA m6A甲基化实验信息数据平台,而且对m6A修饰位点分布的评估工作具有重要的意义。 针对 RNA 甲基化谱中的低表达基因难处理的问题,本文设计了一种基于属性权重的层次聚类算法,该算法给不同的输入数据分配合适的权重,通过仿真数据和真实数据集上的实验分析表明,此算法对噪声抑制效果理想,聚类准确度更高。针对属性加权层次聚类算法存在的需要预先设置聚类个数的问题,本文又设计了一种基于 Dirichlet 过程贝塔二项式混合模型(DPBBM)的聚类算法,该算法不仅能够自主确定最佳的聚类个数,还可以妥善地处理低表达基因噪声高、甲基化水平估计困难等问题。仿真数据和真实数据集上的实验结果表明,DPBBM比其他五种聚类算法(Hierarchical Clustering、K-means、Mclust、NMF、EMClust)的聚类性能更好。

著录项

  • 作者

    王怀志;

  • 作者单位

    中国矿业大学;

  • 授予单位 中国矿业大学;
  • 学科 信息与通信工程
  • 授予学位 硕士
  • 导师姓名 刘辉;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    测序; 数据; 生物信息学;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号