同源寡聚蛋白质的信息熵分类方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

人类基因组计划已进入到后基因组时代，对蛋白质结构和功能的研究和预测成为其主要的研究方向之一。由于通过实验确定蛋白质的结构和功能速度较慢，而且会遇到一些目前无法解决的困难。因此探索利用理论及计算方法来从氨基酸序列快速地推断出蛋白质的结构和功能具有重要意义。本文从氨基酸序列出发，研究了同源寡聚蛋白质分类，主要工作如下：本文介绍了特征提取方法和同源寡聚蛋白质分类的研究现状，并对同源二聚体和同源非二聚体蛋白质使用了基于伪氨基酸组成成分特征提取和信息熵方法进行分类研究。伪氨基酸组成成分特征提取方法以传统的氨基酸组成成分为基础，又考虑了不同层次残基之间的相互影响，包含了蛋白质序列的许多信息，根据这一特点，本文使用了伪氨基酸组成成分作为特征提取方法。FDOD方法是基于信息熵的信息离散性度量函数，它和叉熵之间存在内在的联系，文中对它们之间的关系进行了研究，并在叉熵的基础上对多分布偏差度量进行了进一步的思考。由于FDOD是叉熵的一种形式，因此在它的基础上根据特征向量的提取情况，对同源寡聚蛋白质进行分类。其分类能力比使用子序列分布为2的FDOD方法要好。本文中在原数据集中随机抽取一些数据构建了一个子数据集，并使用同样的方法对子数据集进行分类。比较了两个数据集的分类结果，表明数据集的大小对分类系统的影响较大。同时，对伪氨基酸组成成分特征提取方法的中权重因子的选取进行了讨论，说明它可用于调节氨基酸序列次序信息对分类系统的影响程度，在计算中可根据结果的优劣适当选取。

著录项

作者
曲娟;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科工程力学
授予学位硕士
导师姓名李兴斯;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类信息论（信息论的数学理论）;
关键词
生物信息学; 同源寡聚蛋白质; 同源非二聚体; 伪氨基酸组成成分; 特征提取; FDOD; 信息熵分类; 氨基酸序列;

相似文献

中文文献
外文文献
专利

1. 一种基于信息熵的自适应k值KNN二分类方法 [J] . 谢妙 ,林泳昌 ,朱晓姝 . 合肥工业大学学报（自然科学版） . 2021,第011期
2. 基于信息熵和BP神经网络的故障分类方法 [J] . 孙海蓉 ,王蕊 ,耿军亚 . 电力科学与工程 . 2017,第003期
3. 基于信息熵的自适应网络流概念漂移分类方法 [J] . 潘吴斌 ,程光 ,郭晓军 . 计算机学报 . 2017,第007期
4. 基于信息熵的懒散关联分类方法 [J] . 黄再祥 ,何田中 ,全秀祥 . 漳州师范学院学报（自然科学版） . 2013,第003期
5. 基于最大信息熵模型的异常流量分类方法 [J] . 钱亚冠 ,关晓惠 ,王滨 . 计算机应用研究 . 2012,第003期
6. 基于支持向量机方法的同源寡聚蛋白质分类 [C] . 宋杰 ,唐焕文 . 中国运筹学会第七届学术交流会 . 2004
7. 基于颜色信息熵与边缘信息熵的图像检索技术研究 [A] . 龙春琳 . 2010

同源寡聚蛋白质的信息熵分类方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅