声明
摘要
图目录
表目录
1.1课题背景
1.2研究的目的和内容
1.3论文组织结构
1.4本章小结
第2章相关技术综述
2.1关系抽取
2.1.1基于有监督的关系抽取
2.1.2基于半监督的关系抽取
2.1.3基于无监督的关系抽取
2.1.4基于远程监督的关系抽取
2.1.5开放域关系抽取
2.1.6针对关系抽取的深度学习模型
2.2半监督学习
2.3神经网络技术
2.3.1卷积神经网络
2.3.2循环神经网络
2.4词向量
2.5本章小结
第3章产业合作关系抽取框架设计
3.1整体框架设计
3.2数据预处理模块
3.2.1数据传输文档格式
3.2.2数据清洗与加工
3.3规则抽取流程
3.3.1规则模板库构建
3.3.2三元组抽取
3.3.3相关企业补全
3.4模型抽取流程
3.4.1目标企业获取及句子筛选
3.4.2相关企业抽取
3.4.3产业合作关系抽取
3.5抽取内容整合模块
3.6本章小结
第4章基于上下文模板约束的半监督关系抽取
4.1半监督关系抽取整体流程设计
4.1.1数据标注
4.1.2生成上下文模板
4.1.3构建训练集
4.1.4训练模型
4.1.5预测伪标签
4.1.6置信度评估
4.2基于词性特征和无池化多层卷积的实体抽取模型
4.2.1词性标注特征嵌入
4.2.2模型构建模块
4.3基于上下文模板约束的关系抽取模型
4.3.1相对位置信息特征嵌入
4.3.2句子编码模块
4.3.3目标函数
4.3.4基于上下文模板的置信度计算
4.3.5防止过拟合的优化
4.4本章小结
第5章实验分析与应用集成
5.1实验数据
5.2实验环境
5.3评价指标
5.4实验结果与分析
5.4.1实体抽取多模型对比实验
5.4.2关系抽取多模型对比实验
5.4.3半监督关系抽取关键参数对比实验
5.5应用集成
5.6本章小结
6.1本文总结
6.2未来研究方向
参考文献
攻读硕士学位期间主要的研究成果
致谢
浙江大学;