首页> 中文学位 >支持向量机及其在生物材料功能研究中的应用
【6h】

支持向量机及其在生物材料功能研究中的应用

代理获取

目录

文摘

英文文摘

前言

1生物信息学简介

1.1生物信息学产生的历史背景

1.2生物信息学研究的主要内容及其科学意义

1.2.1生物信息学数据库的建立、发展与管理

1.2.2基因组及蛋白质组信息分析方法研究

1.2.3“数字化基因”的获取

1.2.4非编码区的信息结构分析

1.2.5完整基因组的比较

1.2.6生物进化的研究

1.2.7大规模基因功能表达谱的分析

1.2.8蛋白质分子空间结构与功能的预测、模拟和分子设计

1.2.9药物设计

1.2.10生物信息学研究的科学意义

1.3国内外研究现状

2几种常用的模式识别技术

2.1蛋白质序列分析与模式识别技术

2.2最近邻分类器

2.3 k-近邻分类器

2.4贝叶斯分类器

2.5聚类分析

2.5.1距离聚类分析

2.5.2相似性聚类分析

2.6人工神经网络

2.7本章小结

3支持向量机原理及算法研究

3.1支持向量机简介

3.1.1支持向量机用于文本分类

3.1.2支持向量机用于手写体数字识别

3.1.3支持向量机用于图象识别

3.1.4支持向量机用于工业生产领域

3.1.5支持向量机用于癌症诊断

3.2支持向量机分类原理

3.2.1线性可分情形

3.2.2非线性可分情形

3.2.3核函数

3.3非线性支持向量机算法及SVM★

3.4 SVM★的初步应用

3.4.1 SVM★对异或(XOR)问题的求解

3.4.2 SVM★208声纳数据样本测试及与同类分类器的性能对比研究

3.5支持向量机的优点和不足

3.6本章小结

4 SVM★及SVMProt网站的创建与使用

4.1 SVM★

4.1.1 SVM★网页界面

4.1.2 SVM★应用流程

4.1.3 SVM★应用实例

4.2 SVMProt

4.2.1 SVMProt网页界面

4.2.2 SVMProt应用流程

4.2.3 SVMProt应用实例

4.3本章小结

5蛋白质分子功能的SVM预测研究

5.1蛋白质分子结构与功能研究现状

5.2 SVM预测结果评价因子及其定义

5.2.1 SVM的分类性能常用评价体系

5.2.2 SVM的分类置信度及其定义

5.3 SVMProt对蛋白质功能的预测研究

5.3.1样本数据采集

5.3.2蛋白质特征向量的构建

5.3.3 SVMProt预测结果分析与讨论

5.4 SVMProt对具有相同功能的远缘/不同功能的同源蛋白质功能的预测研究

5.4.1 SVMProt对具有相同功能的远缘蛋白质的功能预测

5.4.2 SVMProt对具有不同功能的同源蛋白质的功能预测

5.5 SVMProt对SARS冠状病毒蛋白质功能的预测研究

5.5.1 SARS及SARS冠状病毒

5.5.2 SARS冠状病毒蛋白质功能的SVMProt预测结果及分析

5.6本章小结

6中药组方的计算机辅助分类与识别

6.1信息技术与中药现代化

6.2 SVM应用于中药药方识别与新药方的预测

6.2.1计算机应用于中药组方的分析

6.2.2特征向量构造

6.2.3样本采集

6.3 SVM分类结果及讨论

6.4本章小结

7结论与展望

7.1主要结论

7.2研究结果的意义

7.3后续研究工作的展望

致谢

参考文献

附录1:作者在攻读博士学位期间发表的论文

附录2:作者在攻读博士学位期间、参研科研项目、参加国际会议及获奖情况

附录3-1:104声纳数据训练集

附录3-2:104声纳数据测试集

展开▼

摘要

蛋白质结构分析的经典方法是x射线晶体学和多维核磁共振技术。这些技术昂贵、费时,甚至有些蛋白质根本无法用这些方法测出结构;而另一方面,蛋白质测序则显得相对简单、快捷和廉价。因此导致已知序列的蛋白质数量与已知结构的蛋白质数量的差距变得越来越大,迫使人们应用多种模拟技术对蛋白质的结构进行了广泛、深入的研究。经过近30年的研究和发展,蛋白质结构预测的准确率仍然只维持在65%~85%之间。在人类已进入后基因时代的今天,许多未知功能的蛋白质急需进行研究。如何根据蛋白质的结构或仅从序列信息出发来预测蛋白质的功能成为了一个迫切需要解决的问题。以往人们对于蛋白质功能预测主要集中在对于单个或某些特定蛋白质功能的预测上,难以满足生命科学发展的需要。如果从序列决定结构、结构决定功能这条思路出发,先以序列预测结构,再据此预测/推定功能的方式来预测蛋白质的功能,受目前蛋白质结构预测准确率偏低的影响,其准确率无疑又将大打折扣。根据蛋白质结构、功能的预测研究的现状,本文提出从组成蛋白质的氨基酸的物理、化学性质出发,应用机器学习方法一支持向量机(SupportVectorMachine,SVM),直接基于蛋白质序列大规模地预测蛋白质的功能。 本文利用随机梯度上升算法构建了一套通用二类分类器-SVM★。应用声纳数据集及多组蛋白质分类数据集,将SVM★与基于SMO(SequentialMinimalOptimization)算法的SVMlight和基于QP(QuadraticProgramming)算法的SVM-QP同类软件进行了比较研究,结果表明:SVM★的分类性能均优于SVMlight和SVM-QP。 创建了简洁、实用的网上在线通用二类分类软件SVM★网站和网上在线蛋白质功能预测服务软件SVMProt。 首次应用支持向量机算法系统地研究了大量的功能蛋白质家簇的分类问题。对包括酶蛋白在内的69个蛋白质功能家簇进行了样本采集和基于序列的分类研究。经过对完全独立评价样本集的测试及测试结果置信度的统计表明:SVMProt具有很强的蛋白质功能识别本领,其识别准确率在80.5%~99.7%之间。进一步深入研究发现,SVMProt还突破了基于序列比对的蛋白质分类的瓶颈问题,它可以在一定程度上预测具有不同功能的同源蛋白质的功能及具有相同功能的远缘蛋白质的功能。 应用SVMProt对SARS冠状病毒的3个蛋白质(Eprotein,Nprotein和ORF13)进行了预测,结果显示:Eprotein是一种能与膜蛋白结合的蛋白质,Nprotein是一种能与RNA结合在一起的蛋白质,两结果与实际事实完全吻合。SVMProt将未知功能的ORF13预测为一种可能结合到DNA上的核蛋白并兼有病毒体内结构蛋白质的功能,这一结果对治疗SARS疾病的药物研制工作人员具有一定的理论指导作用。 基于草药的性味归经,应用SVM★对传统中药组方进行了分类和识别研究,由此所发现的假阳性样本配方有提供给执业中医师做进一步药理分析和研究的价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号