细胞因子的识别和亚细胞定位方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

细胞因子的识别以及亚细胞结构定位的研究对于探索细胞因子的多样化功能以及生物化学机制有着重要的生物学意义。目前有关细胞因子的研究仍然存在大量问题:基准数据集规模过大;数据集不同类别样例数量的严重不平衡性;不断被发现的新的细胞因子家族等。本文采用了集成分类的机器学习方法来进行细胞因子的识别以及亚细胞结构定位预测的研究。
　　本文主要研究内容包括:
　　(1)细胞因子识别方法研究。分析特定理化属性的氨基酸在蛋白序列中的分布情况，我们提取到了120维属性专一有效的蛋白序列特征;针对基准数据集中正反例样本数的严重不平衡性，我们有效地集成了SMOTE与K-Means采样算法，利用集成采样算法重建了标准的训练集;构建动态选择性循环集成分类器LibD3C，对重建后的训练集进行10折交叉验证，保存训练模型。实验表明本方法得出的训练敏感性与特异性的几何平均值高达97.2％，集成采样算法、集成分类框架以及基于独立属性的特征提取算法是本文的亮点。
　　(2)蛋白质亚细胞定位方法研究。本文依据实验以及文献资料重新整理了亚细胞蛋白的基准数据集，数据表现更全面更完整;分析每条蛋白质序列的位置特异性得分矩阵PSSM，得到20种氨基酸各自的位置特异性平均得分，即提取了蛋白质序列的20维有效序列特征向量;采用MeanEnsemble算法对7种多标记基分类器进行有效集成并对训练集进行学习，保存训练模型。实验得出本方法亚细胞定位的平均准确率是64.27％，与现有最好的效果基本相当，本文的亮点在于以上结果是基于更加完整全面的数据集得出的。
　　(3)细胞因子的亚细胞结构定位分析。利用细胞因子识别的训练模型对Swiss-Prot数据库中下载的548758条未知蛋白序列进行细胞因子预测，对于识别出的4222条细胞因子序列，利用亚细胞定位研究中的训练模型进行测试，测试结果给出了4222条细胞因子在各个亚细胞结构上的分布对比情况，这也是本文的主要创新点之一。

著录项

作者
王振;
展开▼
作者单位

厦门大学;

展开▼
授予单位厦门大学;
学科计算机技术
授予学位硕士
导师姓名曹刘娟;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类细胞学实验与细胞学研究方法;
关键词
细胞因子; 识别方法; 亚细胞结构; 定位预测;

相似文献

中文文献
外文文献
专利

1. 基于复合物信息和亚细胞定位信息的关键蛋白质识别 [J] . 毛伊敏 ,章宇盟 ,胡健 . 科学技术与工程 . 2020,第017期
2. 猪肽聚糖识别蛋白3和4的分子克隆、组织表达和亚细胞定位 [J] . Wataru Ueda ,于琳琳 . 中国畜牧兽医 . 2012,第1期
3. 基于序列关联的蛋白质亚细胞定位识别 [J] . 贾芸1 . 计算生物学 . 2011,第001期
4. 基于N端信号的蛋白质亚细胞定位识别 [J] . 贾芸 ,赵巨东 ,吕军 . 内蒙古工业大学学报（自然科学版） . 2008,第002期
5. 植物细胞中蓝光诱导ROS生成的识别和亚细胞定位检测 [J] . 文锋 ,邢达 ,张玲瑞 . 激光生物学报 . 2008,第006期
6. 烟草谷氧还蛋白NbGRX1的亚细胞定位及抗旱功能研究 [C] . GUO Yushuang ,郭玉双 ,余婧 . 中国烟草学会2017年学术年会 . 2017
7. 基于机器学习的多定位点蛋白质亚细胞定位预测方法研究 [A] . 曹隽喆 . 2013

细胞因子的识别和亚细胞定位方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅