首页> 中文学位 >基于特征筛选方法的原核生物细胞壁裂解酶预测
【6h】

基于特征筛选方法的原核生物细胞壁裂解酶预测

代理获取

目录

声明

第一章 绪论

1.1 生物信息学

1.2 细胞壁裂解酶简介

1.3 细胞壁裂解酶的研究现状

1.4 本论文主要内容

第二章 数据集与方法

2.1 数据集的构建

2.2 特征提取

2.3 特征筛选

2.4 分类算法

2.5 分类结果评价指标

2.6 小结

第三章 结果与讨论

3.1 分类结果

3.2 在线服务软件介绍

3.3 小结

第四章 内溶素与自溶素蛋白探究

4.1 研究现状

4.2 数据集

4.3 三肽特征

4.4 二项分布

4.5 最优特征子集

4.6 分类结果与分析

4.7 小结

第五章 总结与展望

5.1 本文工作总结

5.2 未来工作展望

致谢

参考文献

附录

攻读硕士期间取得的研究成果

展开▼

摘要

由于抗生素的滥用,病原菌的耐药性已经变得越来越强。因此,迫切地需要发展一个更加有效且合理的方式来解决细菌强耐药性的问题。在寻找更加有效的治疗方式时,许多精力都放在了细胞壁裂解酶的研究中。细胞壁裂解酶能够破坏细菌的细胞结构,进而杀死被侵染的细菌,得益于该酶对耐药菌株具有高效能活性,而且导致新型耐药表型细菌出现的概率较低,因此细胞壁裂解酶成为抗菌药物研究的合适候选者。
  面对海量的蛋白数据,提供一个计算方式来准确且有效地预测细胞壁裂解酶是很有必要的。本工作致力于开发一个预测器来识别细胞壁裂解酶。为了这个目的,在本工作中,首先通过搜寻 UniProt数据库收集了一系列客观且严格的蛋白序列。最终,68条细胞壁裂解酶蛋白和307条非裂解酶蛋白序列被选中并构成基准数据集。随后,我们使用改进的伪氨基酸组分来表征蛋白样本序列,不仅包括序列的 g-间隔二肽组分,还包括两个残基之间理化性质的相关性。一种基于方差分析的特征筛选技术被用来获取含有63个特征的最优特征子集,最终支持向量机算法被用来执行预测。Jackknife交叉验证获得了84.82%的最优的平均精度,且此时全局精度为90.13%、auROC为0.926。为了便利其他研究者,我们开发了一个免费的预测器 Lypred,其网址为 http://lin.uestc.edu.cn/server/Lypred。我们确信 Lypred将成为裂解酶研究和抗菌药物研发的有力工具。
  根据物种来源的不同,细胞壁裂解酶又可分为内溶素和自溶素两种。我们将Lypred中的68条细胞壁裂解酶作为数据集构建模型来进一步辨识它们,其中的27条内溶素蛋白作为正样本,余下的41条自溶素蛋白序列组成为负样本集。我们用三肽特征来提取蛋白序列的信息,为了剔除冗余的、嘈杂的特征,使用二项分布来进行特征筛选。最终通过使用对分类最有贡献力的44个特征,支持向量机被用来训练了预测模型。所构建模型的全局精度高达94.12%,auROC也达到了0.986,这证明了所构建模型的强健。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号