首页> 中文学位 >基于深度学习算法的中文文本与SPARQL的转换方法研究
【6h】

基于深度学习算法的中文文本与SPARQL的转换方法研究

代理获取

目录

第一个书签之前

展开▼

摘要

语义搜索技术是当今互联网的新趋势,也是互联网技术发展的热门之一。语义搜索离不开语义网的发展,正是基于语义网的这些标准与技术,才能够让计算机对互联网上的信息进行收集整理和理解推理,进而为用户提供语义搜索的功能。对于这类问题,很多传统的基于领域知识库的问答系统被提出,用于满足用户访问特定知识的需要。这些问答系统通常基于从数据观察得出的手工和统计模型。最近, Seq2Seq架构在序列任务转换工作中的表现让人看到了深度学习的能力。因此,本研究以该深度学习架构为基础,提出一种新的模型用于取代传统问答系统中的手工和统计模型,称为基于Seq2Seq的SPARQL翻译模型,该模型能够实现直接将用户提出的中文自然语言问句转换为SPARQL标记序列,然后生成SPARQL语句这一整个流程,换句话说,就是使用端到端的方法将整个自然语言表达式转换为最终查询。 本研究通过知识抽取技术,以 DBpedia 的数据为蓝本,创建用于本实验的中文领域知识库,其中包含36,714个三元组和678个实体。再通过手动构造的49个查询模板,生成由29400条中文问句和对应的SPARQL语句组成的实验数据。具体实验为使用 Google NMT 开源项目搭建用于本文学习的深度学习架构,在TensorFlow上测试以上所得到的实验数据。以Accuracy评分作为模型的评测标准,多次不同模型参数所进行的实验结果显示,两层双向LSTM与Luong注意力机制的组合在测试数据上的收敛速度最快,也得到了74.8的最高分数。经过对查询模板和实验数据分布的调整,最后的分数提高到了87.6。以上实验表明,基于Seq2Seq的SPARQL翻译模型是一个令人期待的实现基于领域知识库问答系统的新解决方案。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号