声明
摘要
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.3 基于机器学习的蛋白质功能预测
1.3.1 数据集的构建
1.3.2 特征提取
1.3.3 特征选择
1.3.4 预测算法
1.3.5 模型检验与评价
1.4 主要研究内容
1.5 论文组织结构
第二章 基于Stacking方法的噬菌体病毒蛋白预测
2.1 引言
2.2 数据与方法
2.2.1 数据集
2.2.2 氨基酸组成、转换和分布
2.2.3 Bi-profile Bayes
2.2.4 伪氨基酸组成
2.2.5 位置特异性打分矩阵
2.2.6 特征选择
2.2.7 集成学习方法
2.3 结果与讨论
2.3.1 单一特征空间的预测性能
2.3.2 特征选择结果
2.3.3 集成学习方法的预测性能分析
2.3.4 特征选择对Stacking方法预测性能的影响
2.3.5 与现有方法的预测性能比较
2.4 本章小结
第三章 基于分类器选择策略的抗氧蛋白预测
3.1 引言
3.2 数据与方法
3.2.1 数据集
3.2.2 二级结构信息
3.2.3 位置特异性打分矩阵
3.2.4 相对可溶性
3.2.5 氨基酸组成、转换和分布
3.2.6 特征选择
3.2.7 分类器选择策略
3.3 结果与讨论
3.3.1 基分类器的预测性能比较
3.3.2 集成分类器的预测性能比较
3.3.3 集成分类器与基分类器的预测性能比较
3.3.4 特征选择结果
3.3.5 特征选择对集成分类器预测性能的影响
3.3.6 最优特征分析
3.3.7 与现有方法的预测性能比较
3.3.8 网络服务器
3.4 本章小结
第四章 基于分类器融合策略的抗血管生成肽预测
4.1 引言
4.2.1 数据集
4.2.2 Bi-profile Bayes
4.2.3 氨基酸组成、转换和分布
4.2.4 离散傅里叶交换
4.2.5 分类器融合策略
4.3 结果与讨论
4.3.1 不同特征空间的基分类器预测性能分析
4.3.2 不同特征空间的集成分类器预测性能分析
4.3.3 特征选择结果
4.3.4 与现有方法的预测性能比较
4.4 本章小结
第五章 基于欠采样方法的J蛋白类型预测
5.1 引言
5.2.1 数据集
5.2.2 分段氨基酸组成
5.2.3 伪氨基酸组成
5.2.4 位置特异性打分矩阵
5.2.5 特征选择
5.2.6 集成学习方法
5.2.7 性能评估
5.3 结果与讨论
5.3.1 单一特征空间的最优参数
5.3.2 不同特征空间的预测性能分析
5.3.3 集成分类器和基分类器的预测性能比较
5.3.4 特征选择结果
5.3.5 特征选择对集成分类器预测性能的影响
5.3.6 最优特征分析
5.3.7 与现有方法的预测性能比较
5.4 本章小结
第六章 基于少数类过采样算法的芋螺毒素离子通道类型预测
6.1 引言
6.2.1 数据集
6.2.2 氨基酸组成、转换和分布
6.2.3 g间隔二肽组成
6.2.4 理化属性
6.2.5 二级结构信息
6.2.6 少数类过采样算法
6.3 结果与讨论
6.3.1 单一特征空间的最优参数
6.3.2 单一特征空间的预测性能分析
6.3.3 组合特征空间的预测性能分析
6.3.4 特征选择结果
6.3.5 最优特征分析
6.3.6 在训练集上与现有方法的预测性能比较
6.3.7 在独立测试集上与现有方法的预测性能比较
6.4 本章小结
第七章 基于多源特征提取和集成学习的蛋白质-适配体相互作用预测
7.1 引言
7.2.1 数据集
7.2.2 伪K元组核苷酸组成
7.2.3 离散余弦变换
7.2.4 二元位置特异性打分矩阵
7.2.5 无序区域信息
7.2.6 集成学习方法
7.2.7 性能评估
7.3 结果与讨论
7.3.1 不同特征空间的预测性能分析
7.3.2 集成学习方法的有效性
7.3.3 特征选择结果
7.3.4 最优特征分析
7.3.5 与现有方法的预测性能比较
7.3.6 实例分析
7.4 本章小结
第八章 总结与展望
8.1 总结
8.2 展望
参考文献
致谢
攻读博士学位期间发表的论文
攻读博士学位期间参与的科研项目
山东大学;