首页> 中文学位 >基于整合文本挖掘方法的中医证与分子生物学知识的关联分析系统
【6h】

基于整合文本挖掘方法的中医证与分子生物学知识的关联分析系统

代理获取

目录

文摘

英文文摘

声明

致谢

1 引言

1.1整合文本挖掘研究背景

1.1.1海量文本数据积累

1.1.2中医药生物信息学

1.1.3解决生物学问题的新方法:文本挖掘

1.2中医药文献和Medline文本挖掘概述

1.2.1中医药文献知识发现

1.2.2 Medline文献数据库

1.2.3整合文本挖掘的提出

1.3本文的主要贡献

1.4本文的组织

2 文本挖掘相关研究

2.1文本挖掘综述

2.1.1文本挖掘的定义

2.1.2文本挖掘的过程

2.1.3文本挖掘的应用领域

2.2信息抽取综述

2.2.1信息抽取相关概念

2.2.2信息抽取技术的处理对象

2.2.3常见信息抽取方法

2.2.4信息抽取评价指标

2.3生物医学文献挖掘综述

2.3.1生物医学文献挖掘背景

2.3.2命名实体识别概述

2.3.3生物医学实体名称识别

3 复杂网络分析综述

3.1复杂网络分析相关概念

3.1.1网络的分类与定义

3.1.2复杂网络的统计特征

3.2复杂网络分析方法

3.2.1计算节点度分布

3.2.2计算聚类系数

3.2.3计算平均路径长度

3.2.4根据连接数估算边的介数和介数分布

3.3相关Open Source系统

4 基于Bootstrapping的基因名称抽取

4.1 Bubble-bootstrapping技术

4.1.1 Bootstrapping技术

4.1.2模式定义

4.1.3 Bubble-bootstrapping算法

4.2基因名称抽取

4.2.1基因名称命名规则

4.2.2 Bubble-bootstrapping算法改进

4.2.3实验结果和分析

5 中医证与分子生物学知识的关联分析系统的设计与实现

5.1系统实现技术

5.1.1 RCP技术

5.1.2 JUNG图形包

5.2 中医证与分子生物学知识的关联分析系统

5.2.1系统总体框架

5.2.2文献下载模块

5.2.3基于Bubble-bootstrapping技术的术语识别模块

5.2.4关系建立模块

5.2.5可视化界面与分析模块

5.3实验分析

5.3.1关系数据分析

5.3.2功能基因网络

5.3.3基因在证候上分布的相似性分析

6 结论

6.1总结与结论

6.2未来工作

参考文献

作者简历

展开▼

摘要

随着人类基因组计划(Human Genome Project)以及分子生物学、信息科学的发展,不同学科的生物医学数据“爆炸”式增长。如何整合这些数据资源发现其中隐藏的知识一直是系统生物学研究的难点。传统中医学和现代生物医学是完全不同的学科,是一个互补性知识系统。本文结合中医药文献库和Medline开展整合文本挖掘(Integrative Text Mining),对中医证和分子生物学进行的关联分析研究具有重要意义。 信息抽取是文本挖掘中一项重要技术,是在非结构化的自然语言文本中定位相应的结构化数据单元,从而使自由文本数据成为相应的结构化数据。信息抽取是文本挖掘的前期步骤和基础,基于信息抽取的文本挖掘系统是研究趋势所在。 本文在系统分析和阐述信息抽取技术的基础上,结合实际应用开展了生物医学文本挖掘研究。在利用Bubble-bootstrapping算法抽取中文实体名称研究的基础上,对该算法进行了必要的改进,将其应用到基因名称的抽取中。通过对2000篇英文摘要的抽取实验,表明Bubble-bootstrapping算法在英文实体名称抽取领域同样具有良好的应用前景。 其次,在信息整合的思路下,本文结合中医药文献和生物医学文献进行了中医证候基因相关关系知识发现研究。设计实现了基于整合挖掘的中医证和分子生物学知识的关联分析系统Medisco-3S。该系统具备Medline数据自动下载、术语实体识别、实体相互关系计算、可视化展现和网络图分析等功能。

著录项

  • 作者

    王春锋;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 黄厚宽;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP274.2;
  • 关键词

    整合文本挖掘; 分子生物学; 中医证; 知识关联分析;

  • 入库时间 2022-08-17 10:19:27

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号