首页> 中文学位 >使用蛋白质和mRNA序列信息预测蛋白质亚线粒体定位
【6h】

使用蛋白质和mRNA序列信息预测蛋白质亚线粒体定位

代理获取

目录

声明

摘要

第一章 绪论

1.1 线粒体简述

1.1.1 外膜

1.1.2 内膜

1.1.3 基质

1.2 研究背景及意义

1.3 国内外研究现状及分析

1.3.1 数据集

1.3.2 物理化学性质

1.3.3 遗传算法

1.3.4 小波分析

1.3.5 离散增量融合支持向量机(ID-SVM)

1.3.6 SMOTE算法

1.4 论文研究内容及安排

第二章 特征提取及预测算法

2.1 引言

2.2 特征提取

2.2.1 mRNA序列n-mer频数

2.2.2 氨基酸组分

2.2.3 蛋白质的进化信息

2.2.4 同源序列的go信息

2.2.5 氨基酸指数信息

2.2.6 相对溶剂可及性值

2.2.7 平均化学位移

2.3 预测算法

2.3.1 离散增量(ID)

2.3.2 支持向量机(SVM)算法

2.3.3 融合算法

2.3.4 算法评价

第三章 对亚线粒体蛋白质M254的预测

3.1 引言

3.2 数据集

3.3 最优特征参数选取

3.3.1 mRNA序列的三联体频数(3-mer)

3.3.2 分段氨基酸组分(AAC)

3.3.3 蛋白质进化信息(PSSM)

3.3.4 同源序列go信息

3.3.5 最优相关长度

3.3.6 平均化学位移(ACS)

3.4 结果与讨论

3.4.1 各个特征向量对预测结果的影响

3.4.2 独立检验

第四章 M880亚线粒体定位预测

4.1 数据集

4.2 特征信息选取

4.2.1 mRNA结构-序列模式中的三联体频数(sq-str)

4.2.2 蛋白质保守位点进化信息(pssm)

4.3 结果与讨论

4.3.1 mRNA序列的三联体频数的预测结果

4.3.2 mRNA结构-序列模式中的三联体频数的预测结果

4.3.3 蛋白质保守位点进化信息对预测结果的影响

4.3.4 同源序列go信息的预测结果及其分析

4.3.5 氨基酸指数信息对预测结果的影响

4.3.6 相对溶剂可及性值(RSA)的预测结果

4.3.7 分段氨基酸组分(AAC)的预测结果

4.3.8 对比分析单个特征参数对预测结果的影响

4.3.9 融合特征参数预测结果分析

第五章 总结与展望

5.1 工作总结

5.2 工作展望

参考文献

附录

致谢

作者攻读硕士学位期间发表和完成的论文目录

展开▼

摘要

线粒体是很重要的半自主性细胞器,主要为细胞提供能量,还承担了许多其他生理功能,而线粒体的某些功能只有在特定亚线粒体位置中才能实现。研究亚线粒体定位能帮助我们充分了解蛋白质的功能。本文建立了包含mRNA序列信息的亚线粒体蛋白质数据集M254,计算了蛋白质的进化信息、同源序列的go信息、氨基酸指数信息、氨基酸粘性、氨基酸组分、平均化学位移和mRNA序列的三联体频数,利用支持向量机算法和离散增量算法对蛋白质亚线粒体定位进行预测,在jackknife检验下整体的准确率达到97.64%,同时用独立检验也取得较好的结果。
  为了进一步找到预测亚线粒体定位更有效的特征参数,本文又构建包含更多蛋白质、并且具有mRNA序列的数据集M880,计算了同源序列的go信息、氨基酸指数信息、氨基酸组分、蛋白质保守位点的进化信息、mRNA序列的三联体频数。为了进一步确定mRNA的作用,又从mRNA的二级结构入手计算了考虑碱基种类的结构-序列模式中的三联体频数,利用支持向量机算法在jackknife检验下整体的准确率达到96.02%,在独立检验下的预测结果是95.45%,证明我们选择的特征参数及算法更有效。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号