首页> 中文学位 >面向地理学科领域的知识库构建方法研究
【6h】

面向地理学科领域的知识库构建方法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 地理学科领域知识库

1.3 主要研究内容和创新点

1.4 论文组织

第二章 相关研究

2.1 命名实体识别的研究现状

2.1.1 基于浅层模型

2.1.2 基于深层模型

2.2 实体属性值抽取的研究现状

2.2.1 基于Ontology的方法

2.2.2 基于统计机器学习的方法

2.3 比较元素抽取的研究现状

2.3.1 基于词性序列的方法

2.3.2 基于句法规则的方法

2.3.3 基于统计机器学习的方法

2.4 本章小结

第三章 地理学科领域实体识别

3.1 命名实体识别定义

3.2 基于条件随机场的实体识别

3.2.1 条件随机场模型

3.2.2 特征选取

3.3 基于Elman神经网络的实体识别

3.3.1 词向量

3.3.2 Elman神经网络模型

3.3.3 后处理

3.4 实体属性值抽取

3.4.1 百科资源

3.4.2 基于字符串相似度实体属性值抽取

3.5 本章小结

第四章 地理学科领域比较元素抽取

4.1 比较句识别和分类

4.1.1 基于特征词的比较句识别和分类

4.1.2 基于类序列规则的比较句识别和分类

4.2 比较句的比较元素抽取

4.2.1 比较元素定义

4.2.2 回答集编程语言

4.2.3 基于ASP的比较元素抽取

4.3 本章小结

第五章 实验与分析

5.1 命名实体识别实验

5.1.1 实验数据

5.1.2 数据分析

5.1.3 评测标准

5.1.4 实验结果及分析

5.2 比较元素抽取实验

5.2.1 实验数据

5.2.2 数据分析

5.2.3 评测标准

5.2.4 实验结果及分析

5.3 本章小结

第六章 总结与展望

6.1 工作总结

6.2 未来展望

致谢

参考文献

作者简介

展开▼

摘要

地理学科领域知识库的构建对地理高考问答系统的研究至关重要。海量知识库的构建,若仅靠人工进行知识内容的理解、标注,需要消耗大量的人力和时间。因此,本文主要研究地理学科领域知识库的构建,具体包括实体及属性值的抽取、比较句识别分类及比较元素抽取,为基于知识库的问题求解系统提供支撑。本文的主要工作包括:
  (1)地理学科领域命名实体识别,分别采用两种不同的模型对地理学科核心术语和地理区域位置两类实体进行识别。设计选取地理学科领域特征,采用条件随机场模型进行地理学科领域命名实体识别。同时,为了探究词向量对地理学科领域实体识别的影响,从大规模未标注数据中无监督地学习词的语义向量,并综合词的基础特征,作为Elman神经网络模型的输入特征进行命名实体识别。
  (2)地理学科领域实体属性值抽取,在实体识别的基础上,给定实体的常用属性。借助百科类数据,首先抽取实体的页面信息。然后采用基于字符串相似度算法抽取属性值。最后清洗属性值,并通过人工审核,从而实现对实体属性值的抽取。
  (3)地理学科领域比较句分类及比较元素抽取,分别采用基于特征词和类序列规则的方法进行比较句的识别和分类。在比较句分类的基础上,采用基于回答集编程语言(ASP)对比较句的比较元素进行抽取。首先将比较句中词汇的词性、词之间的依存关系、比较特征词和启发式位置等信息转成ASP事实。然后将比较元素抽取规则转成ASP规则。最后采用现有的ASP回答集求解器自动求解。
  实验结果验证了本文所提方法的有效性。在地理学科领域实体识别语料库上的实验结果表明,基于CRF和Elman神经网络的方法对两类实体识别的F1值均在77.69%以上。此外,在地理学科领域比较句语料库上的实验结果表明,基于ASP的比较元素抽取方法不仅简洁高效,而且对于大部分比较元素,都取得了比CRF基准模型更好的实验结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号