基于内存计算的基因型-表型关联技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

伴随生物医学数据得到爆炸式增长，快速发展的生物信息学也在不断剖析这些数据背后隐藏的信息，相关研究已成为热点。识别致病基因是人类健康研究的根本挑战，针对识别致病基因就要通过生物网络了解基因型与疾病表型的关联关系。海量生物数据存储在各种没有统一标准化的数据库中，生物网络都是以这些数据为基础构建起来，而且研究生物网络也是在对探索复杂生命活动。疾病表型与基因型的关联关系对于致病基因的预测和寻找基因导致的疾病都具有深远意义。
　　根据疾病的模块性表明，功能相关的蛋白质会导致相似疾病。由此，研究疾病基因关联方法大多集中于基于计算网络，整合了蛋白质相互作用网络、疾病表型相似性网络和疾病-基因二分网络。在线孟德尔遗传（OMIM）是人类遗传疾病和相关基因的数据库，基于 OMIM数据我们计算形成了疾病表型相似性网络和疾病基因对应网络，再加上蛋白质相互作用网络，整合构建复杂的异构网络。本文介绍了相关的重启游走算法，通过改进网页排序算法 TrustRank后形成YSearch方法。算法首先根据构建网络选择查询疾病（基因）的先验知识（种子集），通过全局网络的随机游走策略迭代处理得到TR分数，然后对候选基因与疾病进行优先级排序，实现预测功能。并且针对算法效果进行留一交叉验证，采用ROC曲线与其他方法比较实验结果，证明算法的良好性能。以此，我们设计并开发了基因疾病的搜索引擎平台YSearch，整个系统是搭建在基于内存计算的spark大数据平台，数据存储在HBase中，并对系统进行相关介绍与优化。本文的算法与平台都可以对疾病诊断与治疗等临床研究提供新思路。

著录项

作者
杨勤;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名臧天仪;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类内存贮器（主存贮器）总论;
关键词
疾病表型; 致病基因; 内存计算; 生物信息学; 搜索引擎;

相似文献

中文文献
外文文献
专利

1. 尿路感染大肠埃希菌生物膜的表型与基因型鉴定和耐药性的关联 [J] . 袁星 ,胥振国 ,苏琰 . 中国抗生素杂志 . 2021,第005期
2. 遗传性凝血因子Ⅴ缺乏基因型和表型的关联研究 [J] . 李可可 ,陈朝霖 ,冯莹 . 上海交通大学学报（医学版） . 2021,第008期
3. 伴心血管异常的先天性晶状体脱位五家系基因型-表型关联分析 [J] . 周宜静 ,杨静 ,曹乾忠 . 中华实验眼科杂志 . 2019,第004期
4. 肥厚型心肌病基因型与磁共振表型的关联性研究进展 [J] . 李元程 ,王杰 ,陈玉成 . 心血管病学进展 . 2019,第002期
5. 伴心血管异常的先天性晶状体脱位五家系基因型-表型关联分析 [J] . 周宜静1 ,杨静1 ,曹乾忠1 . 中华实验眼科杂志 . 2019,第004期
6. NOS1、NPAS4和PCM1基因型与偏执型精神分裂症表型关联 [C] . YU Hong-yan ,于洪岩 ,YANG Yong-feng . 第十八届北方精神医学论坛 . 2016
7. 多囊卵巢综合征表型分析及易感基因基因型-表型关联性研究 [A] . 崔琳琳 . 2013

基于内存计算的基因型-表型关联技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅