首页> 中文学位 >利用知网进行(计算机)自然语言处理
【6h】

利用知网进行(计算机)自然语言处理

代理获取

目录

文摘

英文文摘

独创性声明及关于论文使用授权的说明

第一章 知网简介

1.1汉语自然理解的主要成果

1.2知网理论介绍:

1.2.1知网的提出:

1.2.2知网的哲学

1.2.3知网的特色

1.2.4知网建设的方法

1.2.5知网系统的概貌

1.2.6.概念定义的标注方法和规定

1.3小结

第二章 建立知网类库

2.1建立知网类库的设计原则:

2.1.1基类的设计

2.2.2其他类的设计

2.2建立知网类库的方法:

2.3知网类库的维护

2.4小结

第三章 知识词库的管理系统

3.1 Java的JDBC技术简介

3.1.1 JDBC的工作机制

3.1.2 JDBC API

3.2知网词库的设计

3.2.1使用JDataStore数据库作为后台数据库

3.2.2建立数据表

3.2.3词库的管理系统的设计

3.3小结

第四章 知识库的应用

4.1知识库API的设计思想:

4.2 Java RTTI和Reflection机制的介绍:

4.2.1 RTTI

4.2.2 Reflection机制

4.3知识库API的实现

4.4小结

全文总结

参考文献

致谢

展开▼

摘要

自然语言理解,特别是中文信息处理,一直是计算机界的难题.让计算机来理解和处理丰富的自然语言,极具挑战性.自然语言的计算机处理是一个多学科交叉研究领域.来自计算机科学、语言学、数学等不同学科的研究人员构成了目前这一领域的主要研究力量.自然语言处理就是研究如何能让计算机理解并生成人们日常所使用的(如汉语、英语)语言,使得计算机懂得自然语言的含义,并对人给计算机提出的问题,通过对话的方式,用自然语言进行回答.近十多年来,随着计算机本身以及信息高速公路的飞速发展,中文信息处理开始更加重视语义的研究以及大规模语义词典或大规模知识库的建设.知网的创始人董振东先生在从事多年这方面研究的基础上在中文信息处理中创出新路,提出了知网(HowNet)的概念.知网是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库.它为语言信息处理的研发提供了丰富的知识资源.本文根据董先生提出的知网理论和知网的数据文件,设计并建立了一个较为系统的知识库,并在上层利用知网知识库进行汉语言信息处理方面做了初步的研究.对于知识库的设计,即后台的语言知识表示系统,我们采用了程序表示和数据库结合的方法,即采用面向对象的程序设计方法对知识的概念进行表示,同时在数据库中记录词和程序的对应关系.这样在分析自然语言的时候,面对的不再是一些字符编码的组合,而是一个能描述词意义的对象集合.在知识库的基础之上我们还尝试地设计了知识库的API,为上层进行语言排歧和语义相似度计算等自然语言处理提供访问知识库的接口.最后,本文指出了在设计时的不足以及可能的改进方案.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号