首页> 中文学位 >基于LSTM的化合物与蛋白质关系抽取方法研究
【6h】

基于LSTM的化合物与蛋白质关系抽取方法研究

代理获取

目录

声明

1 绪论

1.1 背景及意义

1.2 研究现状

1.2.1 深度学习的现状

1.2.2 化合物-蛋白质相互作用研究的现状

1.3 文章结构

2 理论基础

2.1 人工神经网络

2.1.1 激活函数

2.1.2 反向传播

2.1.3 优化方法

2.2 递归神经网络

2.3 长短期记忆网络

2.4 关系抽取

3 面向句子级别的化合物-蛋白质关系抽取

3.1 引言

3.2 实验方法

3.2.1 预处理

3.2.2 构建模型

3.3 实验及结果分析

3.3.1 数据集

3.3.2 实验环境

3.3.3 实验参数

3.3.4 评价指标

3.3.5 实验结果

3.4 本章小结

4 面向篇章级别的化合物-蛋白质关系抽取

4.1 引言

4.2 实验方法

4.2.1 预处理

4.2.2 构建模型

4.3 实验及结果分析

4.3.1 数据集

4.3.2 实验环境

4.3.3 实验参数

4.3.4 实验结果

4.4 本章小结

结论

参 考 文 献

致谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

目前,生物医学文献已经成为了生物医学领域的最重要的资源。在生物医学文献中会包含大部分相关领域的知识,而文献的摘要中包含了整篇文献的重要信息。生物医学领域的关系抽取更是结合了深度学习、自然语言处理等计算机技术,通过这些技术可以准确高效地抽取出生物医学实体之间的关系。生物医学领域的关系抽取能够辅助生物医学研究者的工作,对于生命科学领域的研究具有广泛的价值。 本文对生物医学领域的关系抽取进行了研究,主要用到了以下的两种方法: 对于句子级别的关系抽取,使用句子分割的方法,将长度过长的生物医学文献的摘要进行分割,得到若干个句子。对句子中的每个词,生成其独自的词向量,并分别生成其相对于实体对中的两个实体的位置偏移,以生成位置偏移向量,位置偏移向量能很好地在模型中体现出每个词的位置信息。并构建以双向长短期记忆网络为核心的句子级别的模型。本次实验所用的模型在生物医学领域的CHEMPROT语料库上取得了较好的性能。 对于篇章级别的关系抽取,用到的方法是直接对整篇文献的摘要进行实验。首先对数据进行预处理,对于摘要中的每个词,生成其独自的词向量,计算其相对于实体对中两个实体的位置偏移时用到了不同的方法,以得到新的位置偏移向量。并构建了篇章级别的实验模型,其中主要的部分是用到了双向长短期神经网络和两个人工神经网络层。在得到分类结果部分,使用了对多个实体对求和的方法。本次实验所构建的模型在CHEMPROT语料库上也取得了较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号