声明
摘要
1 绪论
1.1 引言
1.2 研究背景
1.2.1 研究意义
1.2.2 研究现状
1.3 论文研究主要内容
1.4 论文结构安排
2 蛋白质数据处理概述
2.1 引言
2.2 蛋白质简介
2.2.1 数据来源
2.3 蛋白质的结构层次
2.4 蛋白质序列分析
2.4.1 位置特异性得分矩阵
2.5 蛋白质二级结构分析
2.5.1 蛋白质二级结构特征
2.6 提取特征向量
2.7 本章小结
3 基于支持向量回归集成的蛋白质-ATP绑定位点预测模型
3.1 引言
3.2 预测模型建立
3.2.1 支持向量机
3.2.2 支持向量回归
3.2.3 朴素贝叶斯
3.2.4 KNN
3.2.5 随机森林
3.3 不平衡处理
3.3.1 随机下采样
3.4 集成方法
3.4.1 最大集成法
3.4.2 最小集成法
3.4.3 平均集成法
3.4.4 加权集成法
3.5 本章小结
4 蛋白质-ATP绑定位点预测与实验
4.1 引言
4.2 性能评估
4.2.1 蛋白质绑定位点检测的评价标准
4.2.2 基于蛋白质水平的k-重交叉验证
4.3 实验结果与分析讨论
4.3.1 特征提取比较实验
4.3.2 最优特征向量选取实验
4.3.3 预测模型比较实验
4.3.4 随机下采样实验
4.3.5 集成实验比较
4.4 本章小结
5 总结与展望
5.1 研究工作总结
5.2 未来的工作与展望
致谢
参考文献
攻读硕士期间发表的论文情况
南京理工大学;