首页> 中文学位 >字符序列的解析数论模型及其在生物信息学中的应用
【6h】

字符序列的解析数论模型及其在生物信息学中的应用

代理获取

目录

文摘

英文文摘

独创性声明及学位论文版权使用授权书

第一章问题的引出

1.1生物测序工程与生物序列数据库

1.1.1基因组测序与DNA序列数据库

1.1.2蛋白质测序与氨基酸序列数据库

1.2分子生物学的一些基础知识

1.3粗粒化与生物序列分析

1.3.1粗粒化与字符表示

1.3.2生物序列分析

1.4现有算法概述

1.4.1海量数据期待有效算法

1.4.2现有算法的粗略分类及简介

1.4.3现有算法的特点及存在的问题

1.5从数论的角度看,生物序列分析的三个基本问题

第二章字符序列的解析数论模型

2.1字符序列的数字化表示

2.1.1字符序列的量化

2.1.2字符串的信息来源与加权统计

2.1.3在实数域上的推广

2.2对偶描述子

2.3对偶描述子用于序列特征提取

2.3.1模式偏离函数与极佳描述

2.3.2序列的重构与失真度量

2.3.3基函数的选择

2.4对偶描述子的交替式学习

2.5对偶描述子用于序列识别

2.6矢量形式、几何表示与应用扩展

2.6.1矢量形式

2.6.2几何表示——对偶曲线

2.6.3应用扩展

2.7 Z曲线理论简介

2.8基于位置权重的序列分析方法之——“位置权重矩阵”

本章小结

第三章对偶描述子方法在生物信息学中的应用举例

3.1对偶描述子用于字符序列特征提取——对偶描述子的学习演示

3.1.1冠状病毒基因组序列的特征提取——对偶描述子的一次性学习演示

3.1.2原核基因编码区公共特征的提取——对偶描述子的交替式学习演示

3.1.3二阶对偶描述子的交替式学习过程演示

3.2对偶描述子用于DNA序列蛋白质编码区的识别

3.2.1对偶描述子用于原核基因识别

3.2.2在人类基因组外显子和内含子识别中的应用

参考文献

发表论文和参加科研情况说明

附录Ⅰ:符号说明

附录Ⅱ:序列扩增的两种方法

致谢

展开▼

摘要

生物信息学领域内的许多课题可以抽象成字符序列处理问题,例如,基因识别、蛋白质二级结构预测等.字符序列所能提供的信息不外乎来自两个方面:组成和排列.组成方面的信息可以用常规的频率去反映.问题的关键是如何反映字符序列的排列信息.该文在综述了现有算法的基础上,尝试着从数论的角度来看待字符序列分析问题,提出了字符序列的解析数论模型.在该模型中,把字符序列看成是数的表示,从而把字符序列分析问题转化成一个数论问题,并用数学分析方法辅助解决.字符序列解析数论模型的核心概念是对偶描述子,因此,该模型有时也称作

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号