首页> 中文学位 >基于指示词语义扩展的词义识别方法的研究
【6h】

基于指示词语义扩展的词义识别方法的研究

代理获取

目录

文摘

英文文摘

第1章 绪论

1.1 概述

1.1.1 词义识别的现阶段的实用

1.2 国内外对词义识别的研究现状

1.2.1 词义的识别的定义

1.2.2 国内外的研究状况

1.3 词义识别的要点

1.3.1 上下文特征选择

1.3.2 机器词典和语义语法知识构造

1.3.3 训练语料

1.3.4 词义的粒度

1.4 本文的主要研究内容

1.4.1 课题来源

1.4.2 主要研究内容

1.5 本文的组织结构

第2章 统计词义识别的资源和识别方法

2.1 词义识别相关资源

2.1.1 知网的简介

2.1.2 WordNet的简介

2.1.3 现代汉语语义词典的介绍

2.1.4 同义词词林简介

2.1.5 语料库资源

2.2 词义识别方法概述

2.2.1 基于词典词义识别方法

2.2.2 有指导的词义识别方法

2.2.3 无指导的词义识别方法

2.3 本章小结

第3章 语义扩展概述

3.1 语义学中词位的概念

3.2 语义中词义变体

3.3 多义词词位变体组合构成的词群关系

3.4 语义扩展的描述和应用

3.5 本章小结

第4章 基于指示词语义扩展的词义识别方法的研究

4.1 指示词识别

4.1.1 指示词识别方法概述

4.1.2 指示词识别的关键步骤和方法

4.2 指示词语义扩展方法概述

4.2.1 指示词语义扩展方法

4.2.2 基于指示词的扩展

4.3 指示词扩展识别的实现

4.4 实验结果及评测分析

4.4.1 实验用语料库

4.4.2 实验分析及评测

4.5 本章小结

结 论

参考文献

攻读硕士期间发表的论文和取得的科研成果

致 谢

展开▼

摘要

随着计算机设备和网络应用的发展,人们越来越关注汉语的信息化建设。通过对与文本有关的词义识别技术的研究,可以使计算机更能理解一篇文章的内容。因此词义识别技术的进步能促进计算机理解人类语言的快速发展。
   现今,自然语言技术的研究方法中一种显著的方法是建立在统计学理论之上的研究方法,而这种方法的发展又依赖于词典和语料。词义识别统计学方法受到语料的规模的大小、词汇分布不平衡、资源知识不完备等几个因素的限制,其内在体现是数据稀疏和小概率词汇频繁出现的瓶颈。本文通过讨论分析词义识别方法和知识资源,本文提出一种新的方法以解决现有词义识别的关键问题。在给出相关方法和资源的介绍和分析后,提出基于指示词语义扩展的解决方法。本文根据词位词群的理论依据,将词典资源和网络文本资源整合起来,扩充语料知识,从而大大的提高词义识别的效能并成功的解决数据稀疏和小概率词汇频繁出现这两个突破的关键性问题。本文首先采用指示词方法来实现词义识别系统。指示词的识别方法里,用最为简单的信息增益熵算法来找到指示词。然后结合同义词词林的上下文环境,收集和研究网络上的词汇,在指示词属于同一语义层次上,找到词汇集合。对这样的集合和网络上搜索的文本句子实例,加工成符合要求的新的词汇集合资源。使用半指导的方法和语言学上的不同的词位集合构成词群的补充性的知识对指示词进行语义扩展计算,得到增强作用的指示词。
   这两个方法共同作用于指示词词义识别技术研究当中,从而达到在较少的时间内获得较优秀的性能。换而言之,本文通过解决数据稀疏和小概率词汇频繁出现的难题,采用对指示词的语义扩展计算,深层次的挖掘出语料知识,并提高在现有有限的语料规模下语料的效能。经实验证明,指示词的语义扩展计算方法确实提高解决数据稀疏和小概率词汇频繁出现的问题,其实验结果的宏平均准确度得到明显提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号