蛋白质亚细胞定位的机器学习方法及其应用研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

蛋白质组研究的开展是生命科学研究进入后基因组时代的里程碑，也是继基因组研究之后的又一“大数据科学”。蛋白质亚细胞定位预测研究是蛋白质组学的重要内容同时也是生物信息学的热点问题。研究单位点和多位点的蛋白质亚细胞位点信息对研究某些疾病的发病机理、药物设计和发现具有重要意义。围绕蛋白质亚细胞定位的机器学习方法及其应用研究这一主题，本文主要工作如下： 1. 提出基于 PsePSSM-DCCA-LFDA 方法的凋亡蛋白质亚细胞定位预测。首先融合伪位置特异性得分矩阵 (PsePSSM) 和去趋势互相关分析 (DCCA coefficient) 对蛋白质序列进行特征提取，然后对提取后的特征信息使用局部Fisher判别分析 (LFDA) 进行降维，最后，将降维后的特征向量输入到支持向量机 (SVM) 分类器预测凋亡蛋白亚细胞的位置。通过jackknife检验获得令人满意的预测结果，并与其它预测方法进行比较。结果表明，在对于蛋白亚细胞定位预测的研究中，我们的方法在现有的方法中发挥补充作用。 2. 提出基于 PseAAC-PsePSSM-WD 方法的凋亡蛋白质亚细胞定位预测。首先融合伪氨基酸组成 (PseAAC) 和伪位置特异性得分矩阵 (PsePSSM) 对蛋白质序列进行特征提取，然后对提取后的特征信息进行二维小波降噪，最后，将降噪后的最佳特征向量输入到支持向量机 (SVM) 分类器预测凋亡蛋白亚细胞的位置。通过jackknife检验获得令人满意的预测结果，并与其它预测方法进行比较。结果表明，本文提出的方法能够显著提高凋亡蛋白质亚细胞定位的预测精度，而且有望用于蛋白质其它属性的预测。 3. 提出基于DMLDA-LocLIFT方法的多标记蛋白质亚细胞定位预测。首先分别利用伪氨基酸组成、伪位置特异性得分矩阵、分组重量编码、二肽组成和 GO信息对蛋白质序列进行特征提取，并将五种算法融合。然后对融合的特征信息进行直接多标记线性判别分析 (DMLDA) 降维。最后，将降维后的最佳特征向量输入到标记特征的多标记学习算法 (LIFT) 分类器中预测多位点蛋白亚细胞的位置。通过jackknife检验，与其它预测方法进行比较，对革兰氏阴性菌、革兰氏阳性菌和植物数据集上的预测准确率达到目前最高的预测精度。结果表明，本文提出的DMLDA-LocLIFT模型能够有效的预测多位点蛋白质亚细胞定位。

著录项

作者
李珊;
展开▼
作者单位

青岛科技大学;

展开▼
授予单位青岛科技大学;
学科统计学
授予学位硕士
导师姓名于彬;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类仪器、仪表;
关键词
蛋白质亚细胞定位; 机器学习方法;

相似文献

中文文献
外文文献
专利

1. 蛋白质亚细胞定位预测的机器学习方法 [J] . 张树波 ,赖剑煌 . 计算机科学 . 2009,第004期
2. 基于机器学习的蛋白质亚细胞定位预测 [J] . 郭丽丽 ,陈月辉 . 信息技术与信息化 . 2011,第005期
3. 机器学习方法在蛋白质折叠结构预测中的应用研究 [J] . 林晓丽 ,周凤丽 . 计算机与数字工程 . 2011,第009期
4. 植物蛋白质亚细胞定位相关研究概述 [J] . 未丽 ,刘建利 . 植物科学学报 . 2021,第001期
5. 基于聚类与特征融合的蛋白质亚细胞定位预测 [J] . 王艺皓 ,丁洪伟 ,李波 . 计算机科学 . 2021,第003期
6. 蛋白质亚细胞定位方法在植物病理学研究中的应用 [C] . 左青 ,ZUO Qing ,DUAN Yu-xi . 中国植物病理学会2011年学术年会 . 2011
7. 基于机器学习的多定位点蛋白质亚细胞定位预测方法研究 [A] . 曹隽喆 . 2013

蛋白质亚细胞定位的机器学习方法及其应用研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅