首页> 中文学位 >《汉语主题词表》本体化的自动生成研究
【6h】

《汉语主题词表》本体化的自动生成研究

代理获取

目录

摘要

第一章 引言

1.1 研究背景

1.2 研究的意义

1.3 国内外研究现状

1.4 本文的内容组织

第二章 《汉语主题词表》与本体

2.1 《汉表》与本体的定义和构成要素

2.1.1 《汉表》的定义和构成要素

2.1.2 本体的定义和构成要素

2.2 《汉表》和本体的比较分析

2.2.1 《汉表》的特点

2.2.2 本体的特点

2.2.3 《汉表》与本体的相同之处

2.2.4 《汉表》与本体的不同之处

2.3 《汉表》与本体融合的必要

第三章 《汉语主题词表》与本体之间映射规则的建立

3.1 基于《汉表》构建本体的原则

3.2 核心概念类的选择原则

3.2.1 《汉表》中叙词的更新、修正

3.2.2 本体中基本概念的确定

3.3 语义关系的对应原则

3.3.1 等同关系的映射

3.3.2 等级关系的映射

3.3.3 相关关系的映射

3.4 领域专家修正

第四章 《汉语主题词表》转换为本体的实现技术

4.1 叙词表转换为本体的工具和方法

4.1.1 叙词表转换为本体使用的工具

4.1.2 叙词表转换为本体使用的方法

4.2 利用Protégé软件进行本体构建

4.2.1 利用Protégé软件进行本体构建的步骤

4.2.2 存在的问题

4.3 《汉表》的数据库形式

4.4 基于Jena的自动生成实现思路

4.4.1 与SQL数据库之间的连接

4.4.2 基于Jena本体构建的步骤

4.4.3 Jena包及全局变量的导入

4.4.4 创建本体模型、类变量和属性变量

4.5 《汉语主题词表》本体形式化表示

第五章 总结和展望

5.1 研究中存在的问题

5.2 展望

参考文献

攻读学位期间取得的研究成果

致谢

个人简况及联系方式

声明

展开▼

摘要

对自然语言中的词汇进行选择、规范、控制,并揭示词汇间的各种关系是叙词表的本质,在自然语言的基础上形成受控词汇的集合,从而构成一个叙词表。叙词表中的每个词汇都称为叙词,每个叙词都表达一定的概念。我国《汉语词表》(以下简称《汉表》)作为一部大型综合性科技检索工具,收词范围包括自然科学、医学、农业、工程技术等各学科领域的主要名词术语,是主题标引、检索和组织目录、索引的主要工具。而本体是一种新型的网络信息组织方法,作为一种能在语义知识层次上描述信息的概念模型工具,已经受到越来越多的关注。但由于本体自身的复杂性,现阶段本体的构建将是一项费时、费力的工作。由于叙词表已经汇集了众多领域专家的知识,包括了各学科领域中比较完整的词汇。因此,有人提议,以现有叙词表为基础构建本体。叙词表中的简单语义关系可以为本体的属性、实例以及各种关系的创建提供指导。本文以《汉语词表》为核心,构建基于词表的本体,对于促进词表在语义网下的发展具有一定的理论意义和实际应用价值。
  本文对《汉表》和本体的定义、构成要素和特点进行了详细的分析,并得出基于《汉表》转换本体的必要性和优越性。结合《汉表》的特点,提出了自身的一套构建本体的程序步骤,针对传统纸质版词表的缺陷,形成了词表的SQL数据库形式。最终借助Java程序调用Jena包自动生成基于《汉表》构建本体的模板,并按照规则提取出限制条件。最终实现《汉表》SQL数据库到本体的自动转换,并使用本体表示语言OWL对词表进行形式化表示。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号