声明
摘要
1 绪论
1.1 研究背景
1.2 研究意义
1.3 研究现状
1.4 本文工作
1.5 本文结构
2 蛋白质交互关系抽取的相关理论
2.1 关系抽取
2.1.1 信息抽取
2.1.2 关系抽取
2.1.3 命名实体识别
2.1.4 蛋白质交互关系抽取
2.2 机器学习
2.3 支持向量机
2.3.1 支持向量机的基本原理
2.3.2 广义分类面与支持向量机
2.3.3 核函数
2.4 语料及测评指标
2.5 工具包
2.5.1 SVMlightTK 1.2
2.5.2 Stanford Parser
2.5.3 MeSH
2.5.4 WordNet
3 基于树核的蛋白质交互关系抽取
3.1 预处理
3.2 特征向量的抽取
3.2.1 词特征
3.2.2 距离特征
3.2.3 语法链接特征
3.3 卷积树核
3.4 卷积树核中句法树的剪裁及动态扩展
3.4.1 卷积树核中句法树的剪裁
3.4.2 卷积树核中句法树的动态扩展
3.5 特征核与树核组合
3.6 实验及结果
3.6.1 基于特征向量的PPI抽取
3.6.2 四种基本句法树的有效性验证实验
3.6.3 三种SPT拓展树的有效性验证实验
3.6.4 特征核与树核组合的有效性验证实验
4 基于语义核函数的蛋白质关系抽取
4.1 蛋白质对语义相似度
4.1.1 蛋白质名称匹配
4.1.2 蛋白质对语义相似度的计算方法
4.2 上下文语义相似度
4.2.1 预处理
4.2.2 上下文语义相似度的计算方法
4.3 语义核函数
4.4 实验及结果分析
5 基于多核组合的蛋白质关系抽取
5.1 多核的结合方式
5.2 实验与结果分析
5.2.1 组合核有效性验证实验
5.2.2 与其他先进方法比较
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢