文摘
英文文摘
上海交通大学博士学位论文答辩决议书
主要符号对照表
第一章 绪论
1.1 课题背景及意义
1.2 机器学习算法
1.2.1 神经网络
1.2.2 支持向量机
1.2.3 决策树
1.2.4 K近邻法
1.3 蛋白质序列特征提取和分类
1.4 核酸序列分类
1.5 论文安排
第二章 蛋白质序列特征提取
2.1 基于序列的传统特征提取方法
2.1.1 氨基酸组份方法
2.1.2 k联体方法
2.2 基于注释的特征提取方法
2.2.1 基因本体(Gene Ontology)
2.2.2 GO特征提取方法
2.2.3 模体特征提取方法
2.3 基于中文分词技术的特征提取
2.3.1 建立词汇表
2.3.2 分词
2.4 基于其他信息的特征提取
2.5 蛋白质亚细胞定位预测实验
2.5.1 基于分词特征的预测结果
2.5.2 与其他方法的比较
2.6 蛋白质同源家族分类实验
2.6.1 SCOP家族分类实验
2.6.2 GPCR蛋白质亚家族分类
2.7 细菌Ⅲ型分泌系统效应蛋白预测
2.7.1 数据集
2.7.2 实验结果
2.8 本章小结
第三章 基于M3-SVM的蛋白质亚细胞定位
3.1 研究现状
3.2 最小最大模块化网络
3.2.1 将多类问题分解为二类问题
3.2.2 进一步分解二类阅题
3.2.3 合并子问题
3.2.4 将二类问题还原为多类问题
3.2.5 多标号问题的分类
3.2.6 任务分解
3.3 实验结果与讨论
3.3.1 实验一
3.3.2 实验二
3.3.3 响应时间比较
3.4 本章小结
第四章 基于领域知识的问题分解
4.1 问题分解的重要性
4.2 随机分解
4.3 超平面分解
4.4 PCA超平面分解
4.5 基于均等聚类的问题分解
4.6 根据领域知识的问题分解
4.6.1 基于生物种属关系的分解策略
4.6.2 基于基因本体的样本划分
4.7 实验结果
4.7.1 基于物种信息分解的实验结果
4.7.2 几种分解策略的比较
4.7.3 基于GO分解的实验结果
4.7.4 与其他方法的比较
4.8 本章小结
第五章 非编码RNA预测
5.1 非编码RNA简介
5.2 实验数据来源
5.3 计算预测流程
5.3.1 生成保守区段
5.3.2 RNA预测工具
5.4 性能评估
5.4.1 查全率
5.4.2 查准率
5.5 实验结果
5.5.1 预测拟南芥ncRNA
5.5.2 根据已知基因和ncRNA筛选
5.5.3 湿实验验证
5.5.4 与APP三元组结果的比较
5.5.5 进一步的结果分析
5.6 本章小结
第六章 总结与展望
参考文献
致谢
个人简历、在学期间的研究成栗及发表的论文