声明
摘要
1 绪论
1.1 研究背景
1.2 研究现状
1.2.1 基于词共现的方法
1.2.2 基于模式匹配的方法
1.2.3 基于机器学习的方法
1.3 本文工作
1.4 本文结构
2 蛋白质关系抽取相关知识
2.1 信息抽取
2.2 句法分析
2.2.1 依存句法分析
2.2.2 深层句法分析
2.3 特征选择
2.4 组合学习
2.5 主动学习
2.6 评测指标和实验语料
2.6.1 评测指标
2.6.2 实验语料
3 基于组合学习的蛋白质关系抽取
3.1 语料预处理
3.2 特征向量构建
3.2.1 上下文特征
3.2.2 句法结构特征
3.3 特征选择
3.4 分类器组合
3.5 实验结果与分析
3.5.1 不同维数的特征在AIMed语料上的性能比较
3.5.2 组合学习在AIMed语料上的性能比较
3.5.3 不同方法在AIMed语料上的性能比较
3.6 本章小结
4 基于主动学习的蛋白质关系抽取
4.1 主动学习
4.1.1 基于不确定性的样本选择
4.1.2 基于版本空间缩减的样本选择
4.1.3 基于泛化误差缩减的样本选择
4.2 线性加权融合
4.2.1 基于特征向量的方法
4.2.2 图核
4.2.3 融合方法
4.3 实验结果与分析
4.3.1 AIMed语料上的性能比较
4.3.2 不同方法在5个语料上的性能比较
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢