摘要:在蛋白质工程(酶工程)研究中,预测定点突变酶的生物活性是一个重要的研究课题,对提高实验效率,降低实验成本有重要帮助。本文介绍我们新近发展的基于氨基酸理化性质的“物理-化学人工神经网络”(Phys-ChemANN)及在酶工程中的应用。在生物信息学中广泛使用的“人工神经网络”(Artificial Neural Network:ANN)是以生物体的神经系统(或人的大脑)为模板建立起来的,缺乏物理和化学的理论基础,因而无法对其计算和预测结果给出有物理和化学意义的解释。理化人工神经网络(Phys—Chem ANN )是依据物理化学的基本原理,结合蛋白质的结构特征建立起来的。rn 在理化人工神经网络中,隐蔽层不再是没有真实意义的虚拟的“神经元”,而是蛋白质的结构单元:氨基酸残基(和/或结构域)。理化人工神经网络共有三个层次,输入层是氨基酸的理化性质参数;隐蔽层是在生物活性中起重要作用的氨基酸位点,输出层是蛋白质完成的生物功能。这三个层次组成了一个有反馈功能和机器学习能力的网络。在三个层次间,依据物理化学的原理。建立了以氨基酸理化性质为参量的线性自由能公式,用以表达蛋白质的生物活性。在线性自由能公式中,理化人工神经网络的三个层次由两组系数相连接,一组是活性氨基酸的理化性质的权重因子,另一组是活性氨基酸位点的权重因子。我们发展了一种“迭代的双最小二乘”rn (IDLS)算法,在训练集里迭代地和交替地解两组系数,建立起预测模型。该模型可用于预测其它变异蛋白质的生物活性。与同类方法相比,理化人工神经网络法不仅有较强预测能力,还可以对预测结果给出有物理化学意义的解释。有助于提高酶工程实验的效率,减少盲目性。