首页> 中文学位 >基于语义文法的术语关系获取方法研究
【6h】

基于语义文法的术语关系获取方法研究

代理获取

目录

摘要

第1章 绪论

1.1 课题来源

1.2 研究背景及相关研究

1.3 研究内容

1.4 论文组织结构

第2章 术语关系的刻画和文法描述

2.1 术语及术语间关系

2.2 术语间关系的分类

2.3 术语间关系的刻画

2.3.1 关于术语X和术语Y的讨论

2.3.2 关系的限制条件

2.3.3 术语关系的公理

2.4 术语关系的描述文法

2.5 本章小结

第3章 术语间公理的获取和验证

3.1 公理关系的获取

3.1.1 非交关系公理的获取

3.1.2 交关系公理的获取

3.2 公理系统的验证

3.2.1 语法正确性检验

3.2.2 冗余性检验

3.2.3 矛盾性检验

3.2.4 遗缺性检验

3.3 公理系统的检验

3.4.本章小结

第4章 术语关系的获取和验证

4.1 术语关系的获取

4.1.1 OMKast的介绍

4.1.2 术语间关系的获取

4.1.3 结果分析

4.2 术语关系预处理

4.2.1 剥离词定义

4.2.2 剥离词种类

4.2.3 剥离词典的建立

4.2.4 剥离方案

4.2.5 剥离结果

4.3 基于特征的术语间关系验证

4.3.1 基于统计的术语关系验证

4.3.2 基于语义语法特征的术语关系验证

4.4 基于特征的术语关系验证实验分析

4.5 基于公理的术语关系验证

4.5.1 公理的验证的顺序问题

4.5.2 公理搜索问题

4.5.3 验证算法

4.6 基于公理的关系验证实验分析

4.7 本章小结

第5章 总结与展望

5.1 工作总结

5.2 研究展望

参考文献

读硕士阶段的研究成果

附录

致谢

声明

展开▼

摘要

知识表示和知识抽取是人工智能领域的重要内容。术语关系获取是知识抽取的一个重要研究方向。术语是指代实体的词语,术语间的关系表达实体间的关系。术语关系获取是指从结构化或半结构化的文本中抽取术语间的关系,按一定的形式存储在计算机中的过程。
  术语关系虽然在定义上大致相同,但在具体的使用中却千差万别。又因为它隐藏在大量的互联网信息中,如果只靠人工获取,将耗费大量的人力、物力。而且即使获取到大量的术语关系,这些关系也常常存在许多正确性判定问题。验证这些关系的正确性也是一个棘手的问题。目前这方面的研究相对较少。本文针对以上这些问题,重点研究名词术语间的关系,从术语关系的形式化定义、获取方法和验证出发,取得以下四个方面的成果:
  (1)术语关系的刻画
  本文总结术语间的各种关系,给出术语间关系的定义、谓词表示以及分类。并从术语关系的描述对象、语料背景、术语关系间的关系三大方面给出了术语间关系的详细刻画。同时,在产生式基础上引入中枢谓词,构建术语关系描述文法。使术语关系文法能够对术语关系的各种自然语言表达形式进行描述,为术语关系的获取打下基础。
  (2)术语关系的获取
  本文通过分析术语关系语料,总结关系对应的文法集合。在OMKast基础上,导入半结构化语料,获取术语关系集。并且根据获取结果,分析总结关系获取问题,给出解决策略。反过来利用解决策略指导文法构建过程,以提高文法解析的正确率。
  (3)术语关系公理的获取和验证
  根据关系的定义,从关系的内在性质和外在联系出发,获取术语关系间的所有公理,构建公理系统。利用LL(1)型文法对其进行语法正确性验证。利用谓词逻辑推导公式,对其进行一致性(或矛盾性)验证。然后参考素瓦的概念图对其进行公理遗缺性检验,参考语义网络图对其进行关系遗缺性检验。并分别给出相应检验方法的算法。
  (4)术语关系的验证
  获得的术语关系中存在大量的干扰词,因此在进行关系的验证之前,先对获取的术语关系进行预处理:建立剥离词库、剥离句模,剥离掉关系中的干扰词。然后分析并总结术语关系的语义特征、语法特征及统计特征,验证关系的相对正确性。最后,结合术语关系相关的公理,讨论公理验证的顺序问题、公理验证的查找效率问题,验证术语关系的相对正确性。并分别给出相应验证方法的算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号