首页> 中文期刊> 《中国生物化学与分子生物学报》 >SPNG+:基于stacking集成策略预测革兰氏阳性菌非经典分泌蛋白质

SPNG+:基于stacking集成策略预测革兰氏阳性菌非经典分泌蛋白质

         

摘要

革兰氏阳性菌通过分泌毒力因子入侵宿主细胞引起化脓性炎症,进而导致疾病的产生,威胁人类健康。识别分泌蛋白有助于了解细菌分泌系统和致病机理,并为进一步筛选出毒力因子奠定基础。由于非经典分泌蛋白质缺乏经典信号肽序列,大规模实验鉴定此类蛋白质相对困难并且耗时耗力。目前,虽相继提出了一些计算预测方法,但它们对革兰氏阳性菌非经典分泌蛋白质的预测性能并不令人满意。本文提出了一个集成学习模型——SPNG+(Stacking ensemble method to Predict Non-classical secreted proteins in Gram-positive bacteria),该模型通过stacking策略融合朴素贝叶斯、随机森林、支持向量机、两个梯度提升树XGBoost和LightGBM以及K近邻算法。五折交叉验证和独立数据集测试结果表明,此集成模型在预测革兰氏阳性菌非经典分泌蛋白质时综合性能优于单一模型、简单的集成学习模型和已有的预测工具。相较过去仅用有限的特征编码方法,或者单一机器学习算法进行构建的预测器,本文提出的方法是对革兰氏阳性细菌中非经典分泌蛋白质研究的有益补充。SPNG+的源代码可以通过https://github.com/weidai00/SPNG获得。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号