首页> 中文学位 >基于图书的概念-描述词知识网络的构建及应用
【6h】

基于图书的概念-描述词知识网络的构建及应用

代理获取

目录

声明

摘要

图目录

表目录

第1章 绪论

1.1 课题背景

1.2 课题意义

1.3 本文的主要工作

1.4 本文的组织结构

1.5 本章小结

第2章 相关研究综述

2.1 知识图谱

2.1.1 谷歌知识图谱

2.1.2 搜狗知立方

2.1.3 百度知心

2.2 组块标注

2.2.1 基于支持向量机的组块标注

2.2.2 基于隐马尔科夫模型的组块标注

2.2.3 基于条件随机场的组块标注

2.3 词嵌入

2.3.1 词嵌入的训练

2.3.2 词嵌入训练工具

2.4 排序学习算法

2.5 本章小结

第3章 概念-描述词知识网络构建关键技术

3.1 概念-描述词知识网络概述

3.2 基于词嵌入匹配的短语抽取算法

3.2.1 算法总体设计

3.2.2 特征设计

3.2.3 模型求解

3.3 目录短语分类

3.3.1 分类算法选择

3.3.2 特征设计

3.4 基于排序学习的描述词排序

3.4.1 模型选择

3.4.2 特征设计

3.5 本章小结

第4章 概念百科生成系统的设计与实现

4.1 概念百科生成系统的需求分析

4.2 概念百科生成系统的架构设计

4.3 概念百科生成系统的模块设计与实现

4.3.1 目录预处理模块

4.3.2 概念-描述词知识网络的构建模块

4.3.3 知识网络存储模块

4.3.4 概念词条目录生成模块

4.3.5 概念词条章节内容生成模块

4.4 系统展示

4.5 本章小结

第5章 实验及结果分析

5.1 实验数据集

5.2 词嵌入匹配算法相关实验

5.2.1 评测标准

5.2.2 组块标注实验

5.2.3 目录短语抽取实验

5.3 短语分类实验

5.4 描述词排序实验

5.4.1 评测标准

5.4.2 实验过程及分析

5.5 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

展开▼

摘要

随着信息技术的普及和互联网技术的飞速发展,人类积累的数据量正在以指数的速度迅速增长。在数字图书馆领域,CADAL已经积累大量的数字图书,并提供了相应的图书阅读服务。显然,每一本图书都包含有大量的知识片段,如果能将这些资源进行分解、关联和再组织,形成按照一定目标、主题组织的内容,将会产生更大的价值。
  鉴于此,本论文在基于CADAL数字图书馆中的海量图书资源的基础上,从图书中构建概念-描述词知识网络,完成对图书知识的抽取和分解;然后在知识网络的基础上生成概念百科,完成对知识的关联和组织。论文的主要工作如下:
  (1)基于数字图书构建了概念-描述词知识网络。首先,本文给出了知识网络的原型。随后,提出了一种基于词嵌入(word embedding)匹配的算法用来解决目录的短语抽取问题,并训练分类器将目录短语分类成概念和描述词,从而构建得到概念-描述词知识网络。
  (2)本文提出基于Learning to Rank算法的百科词条目录生成算法,对从概念-描述词知识网络得到的候选描述词进行排序,使得词条目录反映知识阐述的前后顺序。
  (3)基于短语抽取、短语分类、描述词排序等算法实现了基于概念-描述词知识网络的概念百科生成系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号