摘要
第1章 绪论
1.1 课题研究的背景与意义
1.2 课题的研究现状及发展趋势
1.2.1 UMLS知识源数据库的组成
1.2.2 UMLS的核心算法Metamap
1.2.3 生物的通路数据
1.3 潜在语义分析技术及应用
1.4 本文研究的内容
第2章 数据的获取及预处理
2.1 Ⅰ型糖尿病基因数据获取
2.2 基于UMLS的基因数据扩展
2.3 文章摘要数据的获取
2.4 基于Metamap的文章摘要分解技术
2.5 本章小结
第3章 Ⅰ型糖尿病候选基因定量交叉影响分析
3.1 交叉影响分析的背景介绍
3.2 定量交叉影响分析算法设计
3.2.1 潜在语义分析的主要内容
3.2.2 奇异值分解
3.2.3 奇异值分解中的减秩
3.2.4 交叉影响概率计算
3.3 实验过程及结果
3.4 本章小结
第4章 面向基因、基因组的潜在语义分析
4.1 加入通路数据
4.2 Sprinkling技术
4.3 相似性分数
4.4 面向基因的潜在语义分析实验
4.4.1 扩展矩阵中通路数据的计算方法
4.4.2 扩展矩阵中P值的选取
4.4.3 加入通路数据对基因排名的影响
4.4.4 加入通路数据对相似性分数的影响
4.5 面向基因组的潜在语义分析实验
4.5.1 整合基因组矩阵
4.5.2 扩展矩阵中P值的取值
4.6 本章小结
结论
参考文献
致谢
攻读学位期间发表的学术论文
声明