基于上下文语义相似性约束的蛋白质交互关系识别

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

蛋白质交互(Protein-Protein Interaction,PPI)是生物医学领域一项重要的研究内容，目前由生物医学进行的PPI实验结果主要以文献的形式存储。PPI信息对生物、医药研究有着重要的意义，因此生物医学专家试图以手工收集信息的方法从文献中识别PPI信息，然后以统一的格式保存于关系数据库中。然而，随着生物医学文献大量地增加，以手工收集信息的方式已经难以满足实际需求。因此，研究如何从文献中识别PPI信息是一项亟待解决问题。
　　目前常用的基于机器学习的方法大多是以单个句子为研究对象，这种方法依赖人工标注，且忽略了蛋白质交互的上下文信息。为了避免出现这些问题，本文以大规模语料库为研究依据，根据蛋白质丰富的上下文信息进行PPI识别。本文从文本数据库中收集了蛋白质对的上下文信息，从以下三个方面进行了研究。
　　第一，研究上下文特征，从词性和单词相似性这两个角度对向量进行加权。得到的结果与不进行加权的结果相比，有交互蛋白质对F值提升了2.51％，无交互蛋白质对F值提升了1.85%。
　　第二，根据蛋白质对关系描述文本之间的相似性，从关系相似性角度构建分类器进行PPI识别，重点比较了四种权重计算方法。
　　第三，为了将上下文特征与文本之间的相似性这两种类型的信息进行有效地结合，采用了Minimum Cuts算法，利用上下文之间的相似性约束判断。在实验中，我们选择了不同比例的训练数据构建分类器。实验结果表明，当训练数据为80%时，与只有上下文特征信息的SVM的结果相比，识别结果有了3%-4%的提升。并且，Minimum Cuts以20%的训练数据得到了SVM以80%训练数据得到的识别结果。

著录项

作者
吴红梅;
展开▼
作者单位

南京航空航天大学;

展开▼
授予单位南京航空航天大学;
学科计算机科学与技术
授予学位硕士
导师姓名牛耘;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
生物医学文献; 蛋白质交互; 上下文; 语义相似性; 信息识别;
入库时间 2022-08-17 10:52:34

相似文献

中文文献
外文文献
专利

1. 基于词频统计的蛋白质交互关系识别 [J] . 蔡松成 ,牛耘 . 计算机技术与发展 . 2019,第002期
2. 基于关键词的蛋白质交互关系识别 [J] . 毛宇薇 ,牛耘 . 计算机技术与发展 . 2019,第003期
3. 基于分布式假设的弱监督蛋白质交互关系识别 [J] . 毛宇薇 ,牛耘 . 计算机技术与发展 . 2018,第009期
4. 基于最大期望算法的蛋白质交互关系识别 [J] . 蔡松成 ,牛耘 . 计算机技术与发展 . 2018,第008期
5. 基于迁移学习的蛋白质交互关系抽取 [J] . 李丽双 ,郭瑞 ,黄德根 . 中文信息学报 . 2016,第002期
6. 普适环境下基于脑电的身份及上下文状态识别系统的设计与研究 [C] . 刘泉影 ,毛承胜 ,聂碧娟 . 第七届全国计算机支持的协同工作学术会议暨第五届全国智能信息网络学术会议 . 2010
7. 基于文本关系相似性的蛋白质交互关系识别 [A] . 王宇伟 . 2015

基于上下文语义相似性约束的蛋白质交互关系识别

目录

摘要

著录项

相似文献

相关主题

期刊订阅