首页> 中文学位 >人类肝脏疾病本体的构建及其应用
【6h】

人类肝脏疾病本体的构建及其应用

代理获取

目录

摘要

第一章 绪论

1.1 本体研究的意义

1.2 生物医学本体研究的现状

1.2.1 领域本体构建方法

1.2.2 生物医学领域本体

1.2.3 生物医学领域本体的应用

1.3 论文的研究内容和方法

1.4 论文结构

第二章 人类肝脏疾病本体的构建与评估

2.1 研究背景

2.2 构建材料与方法

2.2.1 资料来源

2.2.2 构建方法

2.3 人类肝脏疾病本体展示

2.3.1 人类肝脏疾病本体简介

2.3.2 人类肝脏疾病本体构建结果展示

2.4 人类肝脏疾病本体的评估

2.4.1 人类肝脏疾病本体结构性统计

2.4.2 人类肝脏疾病本体与其它术语系统的词条覆盖面比较

2.5 小结与展望

第三章 人类肝脏疾病本体在数据库数据构建中的应用

3.1 人类肝脏疾病数据库简介

3.2 肝脏疾病相关遗传学数据的收集

3.3 数据整理

3.3.1 数据格式的统一

3.3.2 数据可信度评估规则

3.4 利用人类肝脏疾病本体进行数据整合

3.4.1 整合方法

3.4.2 结果统计

3.4.3 数据库数据结构设计

3.4.4 数据库网页功能设计与展示

3.5 本章小结

第四章 人类肝脏疾病本体在文本挖掘中的应用

4.1 研究背景

4.2 基于人类肝脏疾病本体字典的文本挖掘

4.2.1 挖掘材料

4.2.2 挖掘方法

4.2.3 结果展示与评估

4.3 讨论与展望

第五章 肝病数据库和肝病本体在肝病发展进程研究中的应用

5.1 背景知识

5.1.1 病毒性肝炎的病理学知识

5.1.2 肝纤维化和肝硬化的病理学知识

5.1.3 肝细胞癌的病理学知识

5.2 材料与方法

5.2.1 数据收集与整理

5.2.2 分析方法

5.3 三种肝病相关基因的生物信息学分析

5.3.1 三种肝病相关基因的功能富集分析和hub基因分析

5.3.2 三种肝病差异基因的功能富集分析和hub基因分析

5.4 小结与展望

第六章 蛋白质相互作用本体的评估与应用

6.1 蛋白质相互作用本体简介

6.2 本体术语长度的选择

6.3 蛋白质相互作用本体的评估

6.3.1 结构统计

6.3.2 建设目标和知识领域覆盖范围

6.4 基于PPIO字典的文本挖掘性能评估

6.4.1 基于PPIO字典的文本挖掘原理

6.4.2 蛋白质相互作用注释标准数据集

6.4.3 基于PPIO字典的蛋白质相互作用注释挖掘性能评估

6.5 小结与展望

结束语

参考文献

附录A.英文词汇缩写对照表

附录C.生物分子文本挖掘标准数据

附录D.四种生物分子文本挖掘方法的结果统计

附录E.论文所附光盘内容目录

致谢

作者在学期间取得的学术成果

声明

展开▼

摘要

本体是对特定领域知识概念化的明确而规范的说明,是描述该领域的概念以及概念间关系等知识的标准化术语系统,也被称为领域本体。在本体中,概念和概念之间的关系被逐一确立,并被赋予明确唯一的定义。本体的使用者运用这些规范化的概念和关系来描述该领域的相关事物和知识,减少了对相同涵义信息的表达异质性,从而实现信息的标准化描述,因此有利于各领域知识和信息在数据库及互联网中的存储与传播,加强了人机之间的理解和交流,是实现语义互联网的重要基础。 与多数其它领域相比,生物医学信息学领域更充分地接受了本体思想,并发展和使用了更多的领域本体。本论文详尽而系统地介绍了生物医学领域中的一个新本体——人类肝脏疾病本体(Human Liver Disease Ontology,HuLDO)的构建过程、评估结果和应用举例,并简要介绍了另一个新本体——蛋白质相互作用本体(Protein-Protein Interaction Ontology,PPIO)的评估和应用过程。这些本体分别在肝脏疾病相关知识和分子相互作用信息的挖掘、整合、交流等方面具有着基础性的意义。 人类肝脏疾病本体(HuLDO)是全面归纳人类各种肝脏疾病概念,并对其进行定义、分类和注释的术语系统,其所收录的疾病概念和术语来源于目前已有的疾病本体和经典术语集,以及国际和国内的肝脏病学领域权威著作。该本体目前共收录了227种肝脏疾病,对每种肝脏疾病均给出其定义、同义词、分类、描述说明等注释信息,还包含了部分疾病之间的多种病理学关系,每条记录的各个知识均经过人工确认并提供其参考来源信息。与已有相似本体和经典术语集相比:HuLDO具有最全面的肝脏疾病类型和最丰富的同义词等注释信息,为进一步的本体应用打下了坚实的基础。 首先,根据HuLDO的疾病分类结构,我们构建了人类肝脏知识总库——LiverAtlas的疾病子库,并利用HuLDO进行了人类肝脏疾病相关基因/蛋白质信息的收集和整合。目前该库从16个已有数据库中整理和收录了与59种肝脏疾病相关的共18,243个遗传学生物分子事件,并对每条疾病与分子的关联性记录的可信度做出了参考评分。目前该库提供数据的浏览、查询、批量下载等功能,并与LiverAtlas的基因子库、蛋白质子库、通路子库等数据库之间建立了完善的数据关联。该数据库为肝脏疾病病理学分子水平的研究提供了丰富的参考信息。 其次,为了不断扩充LiverAtlas疾病子库数据,我们利用HuLDO字典和多种生物分子名称实体识别方法,对文献中的肝脏疾病与基因/蛋白质分子间的关系进行了全面的挖掘。疾病与分子的关系挖掘重点在于疾病名称实体文本挖掘和分子名称实体文本挖掘两个环节,在前一环节中,我们深入地研究了基于HuLDO字典的文本挖掘的技术细节的优化;在后一环节中,我们利用人工构建的标准数据集,客观评估和比较了ABNER工具、GNAT工具,以及自行研发的生物分子名称识别方法的性能,并确定了综合性的优化挖掘策略,并对挖掘结果进行了可视化的展示。 最后,结合HuLDO中所提示的疾病间的病理学关系和肝脏疾病数据库中所收集的各疾病相关分子,我们对“肝炎→肝硬化→肝癌”发展过程中的分子机制加以分析和推测,对三种肝病相关的和独有的基因进行了生物学过程、分子网络和通路、hub基因三方面的分析,并对分析结果逐一做出了生物学的解释,指出了潜在的新的疾病相关基因和生物学事件,为进一步实验研究提供了参考。 蛋白质相互作用本体(PPIO)是基于事件概念模型构建的描述蛋白质相互作用所参与的生物过程、所在的亚细胞定位、所扮演的分子角色、所采用的作用方式、所实现的生物学功能和实验检测手段共六方面特征的本体,其概念和术语来源于Gene Ontology(GO)等权威的相关本体和术语系统。通过与其近似的描述蛋白质相互作用信息的术语系统——PSI-MI的比较发现:PPIO包含较为丰富而全面的蛋白质相互作用相关术语集合,其知识覆盖领域与后者相比各自有所偏重,PPIO是描述蛋白质相互作用的生物学特征和信息的理想本体。通过基于PPIO字典的文本挖掘实验,证实了PPIO在蛋白质相互作用相关生物学知识的文本挖掘等方面具有良好的应用效果和重要的应用前景。 随着本体研究在生物医学领域的不断发展和完善,各种生物医学相关本体必将在生物学相关知识自动挖掘、信息整理、信息整合、数据库构建等方面发挥重要的作用,为生物医学知识信息的高效而准确的沟通和传播提供有力的帮助。

著录项

  • 作者

    杨春媛;

  • 作者单位

    北京协和医学院;

    中国医学科学院;

    清华大学医学部;

    北京协和医学院中国医学科学院;

  • 授予单位 北京协和医学院;中国医学科学院;清华大学医学部;北京协和医学院中国医学科学院;
  • 学科 遗传学
  • 授予学位 博士
  • 导师姓名 贺福初;
  • 年度 2012
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    人类; 肝脏疾病; 本体; 构建;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号