声明
1 背景介绍
1.1 LncRNA-PCG调控网络
1.2 LncRNA靶基因预测的生物信息学方法
1.3 相关机器学习方法介绍
1.3.1 机器学习算法简介
1.3.2 支持向量机
1.3.3 随机森林
1.3.4 Logistic回归
2 材料和方法
2.1 数据来源
2.1.1 LncRNA-PCG关系获取
2.1.2 组学数据来源
2.1.3 基因组注释信息
2.1.4 序列信息来源
2.2 多组学数据处理
2.2.1 ChIP-seq数据
2.2.2 差异表达谱分析
2.2.3 共表达网络
2.2.4 CeRNA关系网络
2.2.5 LncRNA-RBP 关系预测
2.2.6 LncRNA-DNA三螺旋结构预测
2.3 特征提取
2.4 K折交叉验证
2.5 机器学习算法的实现
2.6 研究难点及解决方案
3 结果
3.1 LncRNA-PCG关系的获取
3.2 分类特征选择
3.2.1 转录因子结合与共调节
3.2.2 组蛋白共修饰
3.2.3 共差异表达
3.2.4 基因共表达
3.2.5 CeRNA调节关系
3.2.6 LncRNA-RBP相互作用
3.2.7 LncRNA-DNA三螺旋结构
3.3 分类特征选择
3.3.1 Logistic回归
3.3.2 支持向量机
3.3.3 随机森林
3.4 模型的使用示例
4 讨论
4.1 方法学评价
4.2 算法性能评价
4.3 LncRNA-PCG关系预测评价
5 结论
5.1 研究结论
5.2 LncRNA-PCG关系预测评价
参考文献
附录A 综述:Long noncoding RNA: a Crosslink in Biological Regulatory Network
在学研究成果
致 谢
宁波大学;