首页> 中文期刊> 《现代食品科技》 >基于随机森林和特征选择方法的蛋白质热稳定性影响因素预测

基于随机森林和特征选择方法的蛋白质热稳定性影响因素预测

         

摘要

酶的耐热性对其在食品工业中实现应用至关重要.本文以随机森林算法通过蛋白质序列预测酶的热稳定性,并对影响热稳定性的重要特征进行了分析.计算了从Swiss-Prot数据库获得的1600个包含热稳定性信息的酶的430个特征.采用重复欠抽样法处理数据不平衡问题,采用向后递归特征消去法优选出30个最重要的特征.通过交叉验证和独立测试比较以各特征子集构建的模型,发现仅以氨基酸组成为特征集构建的模型获得了最佳预测效果,模型的总体预测准确率为85.83%、敏感性为89.16%、特异性为73.33%、精度为77.00%、F1度量为74.87%.结果表明氨基酸组成对酶热稳定性的影响最大,嗜热酶中含有更多的谷氨酸、异亮氨酸和赖氨酸,而常温酶中含有更多的谷氨酰胺、丝氨酸和苏氨酸.研究为蛋白质工程改造食品工业用酶的热稳定性提供了一定的理论和方法.

著录项

  • 来源
    《现代食品科技》 |2016年第7期|103-108|共6页
  • 作者单位

    辽宁大学生命科学院 辽宁沈阳 110036;

    辽宁省生物大分子计算模拟与信息处理工程技术研究中心 辽宁沈阳 110036;

    辽宁大学生命科学院 辽宁沈阳 110036;

    辽宁省生物大分子计算模拟与信息处理工程技术研究中心 辽宁沈阳 110036;

    辽宁大学信息学院 辽宁沈阳 110036;

    辽宁大学生命科学院 辽宁沈阳 110036;

    辽宁大学生命科学院 辽宁沈阳 110036;

    辽宁省生物大分子计算模拟与信息处理工程技术研究中心 辽宁沈阳 110036;

    辽宁大学经济学院 辽宁沈阳 110036;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    酶热稳定性; 随机森林; 特征选择; 氨基酸组成;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号