声明
摘要
第一章 绪论
1.1 课题研究背景
1.2 课题研究目的和意义
1.3 相关知识介绍
1.3.1 生物大分子序列
1.3.2 基于机器学习的生物大分子序列预测方法框架
1.4 课题国内外研究现状
1.4.1 蛋白质结构类预测研究现状
1.4.2 蛋白质折叠模式类预测研究现状
1.4.3 细胞因子与其受体相互作用预测研究现状
1.4.4 细胞穿透肽预测研究现状
1.4.5 microRNA前体预测研究现状
1.5 本文的内容和框架
第二章 基于序列与结构特征的蛋白质结构类预测方法
2.1 引言
2.2 基于序列与结构特征的蛋白质结构类预测方法
2.2.1 特征提取方法
2.2.2 随机森林分类算法
2.3 实验结果与讨论
2.3.1 数据集
2.3.2 性能评估方法
2.3.3 与现有方法比较
2.3.4 在更新数据集上方法性能分析
2.3.5 随机森林参数优化结果
2.3.6 特征影响与重要性分析
2.3.7 最优初级序列特征集
2.4 本章小结
第三章 基于集成学习的蛋白质折叠模式类预测方法
3.1 引言
3.2 特征向量化方法
3.2.1 基于PSI-BLAST的特征向量化方法
3.2.2 基于PSI-PRIED的特征向量化方法
3.3 集成分类器构建
3.4 实验结果与讨论
3.4.1 数据集
3.4.2 评价指标
3.4.3 特征参数优化
3.4.4 不同特征的影响
3.4.5 集成分类器分类效果
3.4.6 不同方法在基准数据集上的预测效果
3.4.7 不同方法在更新数据集下的预测效果
3.5 本章小结
第四章 基于局部进化特征的细胞因子与受体相互作用预测方法
4.1 引言
4.2 特征提取方法
4.2.2 Pse-PSSM特征
4.2.3 AAC-PSSM-AC特征
4.2.4 局部进化特征
4.3 实验结果与讨论
4.3.1 数据集
4.3.2 评价指标
4.3.3 局部特征与全局特征的比较结果
4.3.4 不同特征集比较结果
4.3.5 特征参数优化结果
4.3.6 与现有方法的比较结果
4.4 本章小结
第五章 基于自适应k-skip-n-gram特征的细胞穿透肽预测方法
5.1 引言
5.2 自适应k-skip-n-gram特征
5.3 构建数据集
5.3.1 正例集构建
5.3.2 反例集构建
5.4 预测方法
5.5 实验结果与讨论
5.5.1 特征对比实验
5.5.2 特征重要性分析
5.5.3 预测方法对比实验
5.6 本章小结
第六章 基于高质量反例的人类mieroRNA前体预测方法
6.1 引言
6.2 高质量反例集构造方法
6.2.1 高质量反例集对分类模型泛化能力影响
6.2.2 高质量反例集的构造方法
6.3 microRNA前体预测方法
6.3.1 microRNA前体特征提取
6.3.2 支持向量机方法
6.4 实验结果与讨论
6.4.1 microRNA前体数据集
6.4.2 性能评估方法
6.4.3 与现有方法比较结果
6.4.4 高质量反例集对分类性能的影响
6.4.5 不同特征的影响
6.5 本章小结
第七章 总结与展望
7.1 本文工作总结
7.2 未来展望
参考文献
致谢
攻读博士学位期间取得的学术成果