首页> 中文学位 >中文叙词表和英文词表概念映射研究
【6h】

中文叙词表和英文词表概念映射研究

代理获取

目录

声明

致谢

摘要

引言

1 叙词表概念映射相关领域研究现状

1.1 相关概念

1.2 叙词表映射的相关标准

1.2.1 美国Z39.19(2005)

1.2.2 英国BS8723

1.2.3 SKOS映射规范

1.2.4 ISO25964-2

1.3 国内外叙词表映射研究现状

1.3.1 概念映射的规则研究

1.3.2 概念映射的类型研究

1.3.3 概念映射的方法现状

1.3.4 概念映射的应用实践现状

2 中文叙词表和英文词表概念映射方案设计

2.1 词表选择与分析

2.1.1 概念范围

2.1.2 词表选择

2.2 影响映射质量的因素

2.2.1 汉英词表语言背景分析

2.2.2 汉英语词构成特征分析

2.2.3 分类深度引起的术语内涵差异

2.2.4 多义项引起的映射干扰问题

2.2.5 相同术语语义关系间的矛盾问题

2.3 中英文概念映射类型的特征

2.3.1 词表内关系与映射关系

2.3.2 映射关系的对称性和传递性

2.3.3 映射关系的等同程度

2.4 中英文概念映射的方向

2.4.1 映射方向的确定

2.4.2 映射方向引起的结果差异

2.4.3 单双向选择的几个影响因素

3 中英文概念映射的规则

3.1 中英文概念映射的通用规则

3.1.1 源词表概念完全匹配规则

3.1.2 汉语编制方式及使用习惯优先规则

3.1.3 映射关系的优选选择顺序

3.1.4 映射关系的数量控制规则

3.2 简单等同映射的判定规则

3.2.1 基于英语词形的简单等同判定规则

3.2.2 基于汉语词形的的简单等同判定规则

3.2.3 基于用代关系的简单等同映射判定规则

3.2.4 基于概念内涵的的近义匹配判定规则

3.2.5 基于精确匹配推理的等同映射

3.3 复合等同映射的判定规则

3.3.1 基于组代关系的复合等同判定规则

3.3.2 基于概念组配的复台等同判定规则

3.3.3 基于多重属分关系的复合等同判定规则

3.3.4 基于分类思想的复合等同判定规则

3.4 等级映射的判定规则

3.4.1 基于精确匹配继承的等级映射关系

3.4.2 基于现有映射推理的等级映射关系

3.4.3 等级映射的优选匹配顺序

3.4.4 等级映射的深度及关系控制

3.4.5 基于概念定位的等级映射调整规则

3.5 相关映射的判定规则

3.5.1 基于精确匹配继承的相关映射

3.5.2 相关映射比例的控制规则

3.6 矛盾映射的处理规则

3.6.1 代项为近义或反义概念时的映射关系处理

3.6.2 代项为下位概念时的映射关系处理

3.6.3 参项为下位概念时的映射关系处理

3.6.4 多义术语归并时的映射关系处理

3.6.5 错误映射的处理规则

4 中文叙词表和英文词表概念映射方法及实证

4.1 数据预处理

4.1.1 数据选择与导入

4.1.2 概念属性及关系浏览

4.1.3 同义术语归并

4.1.4 矛盾检测与处理

4.2 推荐候选映射

4.2.1 确定核心义原

4.2.2 术语原型化

4.2.3 义原相似度计算

4.3 确定映射类型

4.3.1 基于义原匹配自动识别映射类型

4.3.2 基于义原相似度自动识别映射类型

4.3.3 基于概念关系自动识别映射类型

4.4 排除矛盾映射

4.4.1 精确匹配到多个概念

4.4.2 同时建立多种映射关系

4.4.3 同形异义概念建立映射关系

4.5 存储映射数据

4.6 概念映射结果分析

4.6.1 概念映射质量评价指标

4.6.2 基于义原匹配的映射结果分析

4.6.3 基于义原相似度的映射结果分析

4.6.4 映射方法调整与映射结果分析

结论

参考文献

附录:中英文概念映射结果数据表(部分)

作者简介

学位论文数据集

展开▼

摘要

不同语种词表间的概念映射是知识组织体系互操作的一种主要方式,有助于实现资源集成与跨语言检索,是语义网络构建的基础。文章从叙词表标准及概念映射相关主题,总结了国内外叙词表及概念映射的研究及应用情况,分析了影响概念映射质量的关键因素、映射类型的特征、映射方向对于映射结果的影响等。 结合组配、多重属分关系等理论,文章提出了概念映射的通用规则,如源词表概念均需要找到一个最相近概念,映射过程需要优选考虑汉语编制方式及使用习惯,控制几种映射关系的数量等;也提出了每种映射类型的相应判定规则,如基于词形、用代关系、概念内涵及推理的等同映射判定规则,基于组代关系、概念组配、多重属分关系、分类思想的复合等同判定规则,基于精确匹配继承和现有映射推理的等级映射关系,基于精确匹配继承的相关映射及其比例的控制规则等。也分析了可能出现的矛盾映射情况,如一个概念精确匹配到多个概念。 根据映射规则,进一步转换为可操作的计算机辅助映射方法,选择1562个中文概念与1476个英文概念作为样本,进行具体的映射实证。将部分映射规则量化,并应用到概念自动映射过程中,如自动推荐候选映射、自动识别映射类型、检测矛盾映射等。关于概念映射结果的评价,主要选择映射准确率与映射覆盖率两个指标,根据自动推荐、人工修改或删除的映射关系数量,分析映射方法及规则的适用性。

著录项

  • 作者

    邓盼盼;

  • 作者单位

    中国科学技术信息研究所;

  • 授予单位 中国科学技术信息研究所;
  • 学科 图书馆学
  • 授予学位 硕士
  • 导师姓名 常春;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    中文; 叙词表; 英文;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号