声明
致谢
摘要
1 引言
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 国外信息抽取研究现状
1.2.2 中文信息抽取研究现状
1.3 论文主要内容
1.4 论文组织结构
2 实体知识库系统及相关技术
2.1 系统整体结构
2.2 数据抓取部分
2.2.1 维基百科数据抓取
2.2.2 新闻数据抓取
2.3 信息抽取相关技术
2.3.1 命名实体抽取
2.3.2 实体关系抽取
2.4 本章小结
3 基于CRF的命名实体识别
3.1 命名实体特征
3.2 命名实体识别模型
3.2.1 命名实体识别流程
3.2.2 地名实体识别校准
3.2.3 组织机构实体识别校准
3.3 CRF模型训练算法
3.3.1 CRF模型参数估计
3.3.2 CRF模型训练
3.4 特征集的构建
3.4.1 训练语料的转换
3.4.2 特征模板
3.5 特征选择
3.6 实验及结果
3.6.1 评价标准
3.6.2 实验及结果分析
3.7 本章小结
4 无监督实体关系抽取
4.1 实体关系抽取模型
4.2 实体关系对筛选
4.3 关系特征词提取
4.4 关系特征词聚类
4.4.1 聚类技术
4.4.2 无监督关系抽取聚类方法
4.4.3 基于词向量的AP聚类
4.5 实验及结果
4.5.1 评价标准
4.5.2 实验及结果分析
4.6 本章小结
5 总结及展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集