首页> 中文学位 >国家叙词库框架及其语义映射研究
【6h】

国家叙词库框架及其语义映射研究

代理获取

目录

声明

致谢

摘要

引言

1 叙词库研究现状

1.1 多表集成项目及集成模式研究

1.1.1 国外研究现状

1.1.2 国内研究现状

1.2 多表集成相关研究

1.2.1 框架结构

1.2.2 知识建模和描述

1.2.3 概念相似度计算

1.2.4 多表映射

1.2.5 多表融合

1.3 集成系统的服务与应用

2 国家叙词库框架结构

2.1 国家叙词库的建设原则

2.2 体系结构

2.2.1 数据获取与转换层

2.2.2 存储与语义集成层

2.2.3 服务与应用层

2.3 国家叙词库元数据框架

2.3.1 国家叙词库中叙词表宏观结构及其描述

2.3.2 国家叙词库中叙词表微观结构及其描述

3 国家叙词库语义映射规则

3.1 映射类型

3.1.1 等同映射

3.1.2 等级映射

3.1.3 相关映射

3.2 映射规则

3.2.1 通用规则

3.2.2 等同映射规则

3.2.3 等级映射规则

3.2.4 相关映射规则

4 国家叙词库语义映射实现过程

4.1 实验数据

4.1.1 数据范围

4.1.2 数据预处理

4.1.3 叙词表语义描述特征分析

4.2 自动映射过程

4.2.1 自动映射流程

4.2.2 基于词形的自动匹配

4.2.3 基于英文的自动匹配

4.2.4 基于关系传导的自动匹配

4.2.5 基于相似度和同义词典等匹配

4.3 人工审核

4.4 映射加工平台

4.5 映射结果分析

5 国家叙词库语义映射质量分析

5.1 自动映射产生的逻辑问题

5.1.1 “一对多”与“多对一”的等同映射问题

5.1.2 “一对一”的等同映射问题

5.2 映射影响因素分析

5.2.1 概念颗粒度

5.2.2 概念语义模糊

5.2.3 语义关系结构

5.2.4 学科背景

5.3 映射规则改进

5.3.1 通用规则补充

5.3.2 等同映射规则补充

5.3.3 等级映射规则补充

5.3.4 相关映射规则补充

5.3.5 组配映射的新增及规则

5.3.6 逻辑问题处理规则

5.3.7 映射完整性判断规则

结论

参考文献

附录

作者简介

学位论文数据集

展开▼

摘要

论文界定了叙词表、集成词表、叙词库、国家叙词库的概念内涵,对比分析了国内外相关的多表集成项目构建方式,通过比较分析现有的几种多表集成模式的优缺点,确定了国家叙词库采用映射的语义集成模式;综述了集成词表框架结构、知识建模和描述机制、多表映射的相关技术(概念相似度计算、映射方法、映射类型等)以及现有的集成系统服务与应用方式。
  结合国家叙词库的功能定位,本着服务和应用的目标,研究确定了国家叙词库体系结构分三个层次构建:数据获取与转换层、存储与语义集成层、服务与应用层。论文提出国家叙词库的多表管理元数据框架的对象为叙词表,进而从宏观结构和微观结构两个层面来对叙词表进行描述。通过对来源表的宏观结构和微观结构的分析,基于DC元数据框架设计了叙词表元数据方案;基于SKOS+XL设计了概念和词汇描述元数据方案。
  为国家叙词库语义集成实验确定了映射类型,针对每种类型提出了相应的判断规则,并分别选取了9部叙词表的环境科学领域、共5622个概念作为样本数据进行语义集成实验。通过对叙词表语义特征分析、自动映射结果和人工审核结果分析,发现自动匹配的逻辑问题以及影响映射的因素,重点以实例形式来分析逻辑问题产生原因以及映射影响因素,并在此基础上提出基于映射的国家叙词库语义集成规则改进方案和逻辑问题处理方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号