声明
第1 章绪论
1.1研究背景与意义
1.2 国内外研究现状
1.2.1 关系抽取研究现状
1.2.2 远程监督关系抽取研究现状
1.2.3 医学领域关系抽取研究现状
1.3 本文研究内容概述
1.4 本文组织架构
第2 章相关理论知识介绍
2.1 远程监督技术
2.2 命名实体识别技术
2.2.1 基于规则与字典的命名实体识别
2.2.2 基于统计的命名实体识别
2.2.3 基于混合方法的命名实体识别
2.3关系抽取技术
2.3.1 有监督关系抽取
2.3.2 无监督关系抽取
2.3.3 半监督关系抽取
2.3.4 多示例学习
2.4 本章小结
第3 章基于远程监督的关系抽取方法研究
3.1 任务概述
3.2 领域知识库构建
3.2.1 创建医学术语词典
3.2.2 获取PubMed摘要
3.2.3 创建先验知识库
3.3 基于统计共现生成基础语料
3.4 实体校正
3.4.1 基于BioBERT的实体识别校正
3.4.2 基于规则的实体链接校正
3.5关系标志词过滤
3.5.1 关系标志词定义
3.5.2 关系标志词获取
3.5.3 关系标志词过滤
3.6 关系抽取
3.7 实验与分析
3.7.1 实验方案
3.7.2 结果分析
3.8 本章小结
第4 章医学关系标志词聚类方法研究
4.1 任务概述
4.2 疾病-基因本体类别分析
4.3 基于TransE的关系标志词特征表示
4.3.1训练语料预处理
4.3.2关系标志词特征表示
4.4 基于Word2Vec的关系标志词特征表示
4.4.1训练语料预处理
4.4.2关系标志词特征表示
4.5 关系标志词聚类研究
4.6 实验结果与分析
4.6.1 评价指标
4.6.2 结果分析
4.7 本章小结
第5 章肺癌领域信息检索分析与可视化展示系统
5.1 任务概述
5.2 图谱存储与信息统计
5.2.1 存储方案
5.2.2 知识图谱信息统计
5.3 系统需求分析
5.4 系统设计与实现
5.4.1 系统总体架构
5.4.2 数据采集与检索模块
5.4.3 数据流处理模块
5.4.4 系统应用模块
5.5 系统展示与分析
5.6 本章小结
总结与展望
本文工作总结
未来工作展望
参考文献
致谢
攻读硕士学位期间发表的论文及其它成果
西南交通大学;