声明
摘要
第一章绪论
1.1研究背景与意义
1.2国内外研究现状
1.2.1蛋白质功能预测研究现状
1.2.2基于机器学习的特定种类蛋白预测
1.3主要研究内容
1.4论文章节安排
第二章海藻固碳蛋白数据预处理和序列特征提取
2.1藻类同碳蛋白相关数据获取和重采样
2.1.1海洋藻类固碳蛋白数据获取
2.1.2重新采样处理
2.2蛋白序列特征提取方法介绍
2.2.1官能团方法
2.2.2香农熵方法
2.2.3自相关方法
2.2.4K-mers方法
2.3本章小结
第三章海藻固碳蛋白的特征选择和预测模型构建
3.1特征选择
3.1.1特征选择的三类方法
3.1.2特征归一化
3.2预测算法
3.2.2朴素贝叶斯算法
3.2.3神经网络算法
3.2.4随机森林算法
3.2.5支持向量机模型
3.2.6XGBoost模型
3.3评价指标
3.4本章小结
第四章基于机器学习和综合序列特征的海藻固碳蛋白预测
4.1海藻同碳蛋白预测方法的性能评估
4.1.1使用单一类型特征的性能评估
4.1.2整合特征的性能评估
4.1.3特征选择后的性能评估
4.2海藻固碳蛋白的特征分析
4.2.1特征的显著性分析
4.2.2海藻固碳蛋白序列基序
4.3本章小结
第五章总结与展望
5.1全文工作总结
5.2创新点及不足
5.3未来工作展望
参考文献
致谢
攻读学位期间发表的研究成果
山东大学;