首页> 中文学位 >区域科技企业知识图谱的构建与应用
【6h】

区域科技企业知识图谱的构建与应用

代理获取

目录

声明

第 1 章绪 论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 知识图谱研究现状

1.2.2 知识图谱表示学习研究现状

1.2.3 知识图谱可视化平台研究现状

1.3.1 论文研究内容

1.3.2 论文章节安排

1.4 本章小结

第 2 章预备知识

2.1.1 本体描述

2.1.2 资源描述框架模型

2.1.3 知识推理

2.1.4 Neo4J图数据库

2.2 表示学习相关知识

2.2.1 Word2Vec模型

2.2.2 Doc2Vec模型

2.2.3 翻译模型TransE及改进

2.2.4 HAKE模型

2.3.1 Scrapy爬虫框架

2.3.2 Spring Boot框架

2.3.3 D3.js可视化库

2.4 本章小结

第 3 章区域科技企业知识图谱构建

3.1 区域科技企业介绍

3.2.1 构建方法

3.2.2 模型构建

3.3 企业数据清洗

3.4.1 数据获取

3.4.2 实体对齐与关系对齐

3.5 RDF三元组生成

3.6 本章小结

第 4 章知识推理与表示学习

4.1.1 Protégé关系推理

4.1.2 Jena推理机

4.1.3 Neo4J数据库存储

4.2 嵌入模型与模型设置

4.2.1 基于Doc2Vec与HAKE模型的嵌入方法

4.2.2 Doc2Vec模型参数设置

4.2.3 HAKE模型参数设置

4.3 嵌入结果分析

4.3.1 Doc2Vec模型嵌入结果分析

4.3.2 HAKE模型嵌入结果分析

4.3.3 基于Doc2Vec与HAKE模型嵌入结果分析

4.4 本章小结

第 5 章区域科技企业信息检索系统

5.1 研究背景

5.2.1 区域科技企业信息检索平台构建需求

5.2.2 区域科技企业检索系统可视化需求

5.3.1 系统架构

5.3.2 系统功能

5.4 系统详细设计

5.4.1 数据连接与结果获取

5.4.2 服务层逻辑实现

5.4.3 控制层逻辑实现

5.4.4 可视化功能实现

5.5.1 用户管理

5.5.2 行业地域筛选

5.5.3 关键词检索

5.5.4 实体关系插入

5.5.5 图谱融合

5.6 本章小结

结论与展望

本文工作总结

未来工作展望

致谢

参考文献

攻读硕士学位期间发表的论文及科研成果

展开▼

摘要

作为国家的重要战略资源,科技资源为科技活动提供了物质保障,为科技管理、决策和科学研究提供了基本性条件保障。科技资源在科技活动中的基础性作用逐渐被认识,并被赋予“第一资源”的历史地位。而企业不仅是科技资源的重要消费者,也是科技资源的重要组成部分。目前,中国中小型企业超过3000万家,个体工商户数量也超过7000万户。随着科学技术的不断发展,各企业普遍采用信息化技术进行科技资源管理,激增大量高质量的科技资源信息,但是这些科技资源由企业独立创建和维护,缺少整合共享,形成了大量分散、分离的“信息孤岛”,未能得到充分有效的利用。除了信息繁杂分散外,人们在利用企业信息时往往来自于个人的印象、他人的评价或对企业部分信息的解读,对于企业的全部信息无法有效利用。  针对上述问题,本文完成如下工作:  (1)构建京津冀科技企业知识图谱。首先使用京津冀科技企业数据,设计本体模型,进行格式标准化和数据清洗;接着利用爬虫获取额外企业信息,对原始数据进行信息补全,随后生成RDF三元组,完成企业知识图谱的构建;研究基于Jena的知识推理技术,对构建完成的知识图谱进行知识推理,并将推理出的内容补充到知识图谱中;最后采用Neo4J图数据库存储知识图谱,支持Cypher语句查询和查询结果可视化展示。  (2)提出了基于Doc2Vec模型与HAKE模型的企业知识图谱嵌入表示方法。首先使用Doc2Vec模型对企业经营范围等描述信息进行嵌入表示,得到企业节点向量和文本的词向量;再利用HAKE模型对知识图谱进行表示学习,并将基于Doc2Vec模型的节点嵌入表示作为HAKE模型的预训练向量,得到知识图谱中各实体和关系的嵌入表示;最后通过对比实验,验证了所提出的方法可以有效提高企业信息检索的准确率。  (3)构建区域科技企业信息检索系统。利用构建完成的知识图谱进行二次开发,采用SpringBoot框架为后台连接Neo4J数据库,将用户的检索信息转化为Cypher查询语句获取检索结果,将数据操作过程隐藏在后台,降低知识图谱的使用成本;使用D3.js完成结果的可视化表示便于用户理解。系统提供了用户管理、条件筛选、关键词检索和数据管理等功能,以满足用户对企业详细信息的检索需求。测试结果表明,知识图谱嵌入可以提高知识图谱的可用性,有助于深入挖掘节点内在的信息,为合理有效地利用科技企业资源提供了新的思路。

著录项

  • 作者

    刘畅;

  • 作者单位

    西南交通大学;

  • 授予单位 西南交通大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 李天瑞;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    区域科技企业,知识图谱,Cypher语句查询;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号