首页> 中文学位 >基于迁移学习的基础教育地理领域概念关系抽取
【6h】

基于迁移学习的基础教育地理领域概念关系抽取

代理获取

目录

声明

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 存在问题分析

1.4 论文主要内容和结构

第2章 基于LSTM神经网络的地理概念关系抽取

2.1 概念关系类型

2.2 概念关系语料库的构建

2.3 基于LSTM神经网络的概念关系抽取

2.4 共享信息迁移

2.5 本章小结

第3章 基于LSTM神经网络的迁移学习

3.1 领域属性

3.2 基于Word Embedding的词向量迁移学习

3.3 基于网络权重的迁移学习

3.4 本章小结

第4章 基于多潜在特征空间层的地理领域迁移学习

4.1 领域适应性问题

4.2 地理领域的特征矩阵

4.3 基于多潜在特征空间层的地理领域迁移学习模型

4.4 实验结果与分析

4.5 本章小结

第5章 总结和展望

5.1 总结

5.2 展望

致谢

参考文献

攻读硕士学位期间主要的工作

展开▼

摘要

本文以基础教育地理学科为研究对象,针对地理领域的概念关系抽取进行研究。但是,地理领域目前没有充足的语料支撑概念关系抽取研究。传统的解决方法是人工扩充语料库,但其人力成本高,而迁移学习方法能够迁移源领域的知识帮助目标领域解决仅有少量数据的问题,故本文研究如何基于迁移学习解决地理语料不充足的问题,以提升地理概念关系抽取的准确率。论文的主要研究工作如下: 1)针对基础教育地理文本的时序性特征,利用长短期记忆(Long Short-term Memory, LSTM)神经网络,构建了基于词特征和句子特征的概念关系抽取模型。本文将地理概念关系抽取定义为基于给定概念对的关系语句分类问题,词特征是概念对的基本特征,使用Word Embedding进行提取;句子特征能够完整表达语句序列的语义信息,而LSTM因能有效利用序列数据中长距离的依赖信息,被认为适合处理文本序列数据,故使用LSTM提取概念对所在句子的句子特征。在地理概念关系语料不充足的情况下,该方法的准确率较低。 2)针对地理概念关系语料缺乏的问题,提出了基于LSTM的迁移学习方法,该方法将开放领域的知识迁移到地理领域,辅助地理领域更准确地完成概念关系抽取。该方法由两部分组成:Sogou词向量经由大量数据训练得到,其特征表示比使用少量地理文本训练得到的词向量更准确,故首先提出了基于Word Embedding的词向量迁移学习方法,将Sogou词向量迁移到地理领域,进行对比实验。由于迁移后词向量的特征空间不一致,导致该方法对准确率的提升不明显。因而,进一步提出了基于网络权重的迁移学习方法,该方法先将使用开放域文本训练得到的LSTM网络权重按层迁移到地理领域;然后地理领域针对迁移的网络权重做了两种处理:保持不变和重训练调整,进行对比实验。实验结果表明,若使用地理文本对迁移的网络权重进行重训练调整,能较显著提升地理概念关系抽取的准确率。但该方法没有解决知识迁移过程中,因数据分布不一致产生的领域适应性(Domain Adaptation)问题。 3)为了解决开放领域向地理领域进行知识迁移过程中产生的领域适应性问题,构建了基于多潜在特征空间层的地理领域迁移学习模型。该模型首先利用开放领域和地理领域间的相同概念建立一个共享的潜在空间;然后利用两个领域的特有概念,分别建立三个特有的潜在空间,并将三个特有空间和共享空间组成三个潜在特征空间层,同时用于学习两个领域间的数据分布。此外,该模型采用非负矩阵三因子分解(Nonnegative Matrix Tri-Factorization, NMTF)技术解决模型优化问题。该方法能初步解决两个领域间的领域适应性问题。

著录项

  • 作者

    王娜;

  • 作者单位

    武汉理工大学;

  • 授予单位 武汉理工大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 熊盛武,段鹏飞;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 中等教育;
  • 关键词

    迁移学习; 基础教育; 地理; 概念;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号