摘要
第一章:文献综述 蛋白质序列数据挖掘研究进展
1蛋白质相关数据库
1.1蛋白质序列数据库
1.2蛋白质模体基序类数据库
1.3蛋白质结构数据库
1.4其他特异蛋白质序列
2生物学软件
2.1常用的蛋白质分析软件
2.2 EMBOSS和GCG
2.3 Linux[30],Perl[31]和MySQL[32]及其他
3蛋白质分子模拟介绍
3.1同源建模法
3.2穿线(threading)和折叠识别建模法
3.3从头预测法
第二章前言
第三章材料与方法
3.1序列的选择
3.2本研究所使用的系统及其配置
3.3蛋白质内部重复片段的取得
3.3.1偶然匹配概率
3.3.2替代打分矩阵
3.4全局矩阵分析
3.4.1四肽片段处理
3.4.2四肽矩阵的构建
3.4.3举例说明
3.5氨基酸成分分析
3.6互联网资源
3.7流程图
第四章结果
4.1蛋白质组与内部重复片段的初步统计
4.2蛋白质内部重复片段的总体分布(矩阵分析)
4.3蛋白质组和蛋白质内部重复片段的氨基酸成分分析(Pepstats分析)
4.4氨基酸分类分析
第五章讨论
第六章参考文献
第七章附录
附录1:EMBOSS的蛋白质研究相关软件分类和功能概述
附录2:源程序代码所涉及的EMBOSS程序(来自于EMBOSS Manual)
致谢
浙江大学;