首页> 中文学位 >基于语义类词法信息的词义消歧
【6h】

基于语义类词法信息的词义消歧

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题研究的学术背景及意义

1.2 词义消歧研究现状及分析

1.3 词义消歧研究的瓶颈问题

1.4 本文的课题来源及组织结构

第2章 词义消歧的方法统计

2.1 基于规则的消歧方法

2.2 基于统计的消歧方法

2.3 基于知识库的消歧方法

2.4 本章小结

第3章 词义消歧语言学资源

3.1 语料来源

3.2 语料解析工具

3.3 语料标注体系

3.4 语料性能统计

3.5 本章小结

第4章 基于上下文的混合特征提取

4.1 消歧特征概述

4.2 词义消歧的特征选择

4.3 特征的概率统计与分析

4.4 本章小结

第5章 基于SVM的汉语词义消歧分类器

5.1 词义消歧系统的分类流程

5.2 基于混合特征的SVM分类模型

5.3 实验结果分析及讨论

5.4 本章小结

结论

参考文献

攻读硕士学位期间所发表的学术论文

致谢

展开▼

摘要

汉语的词汇组合搭配的灵活性和变通性,导致中文词汇歧义现象的产生。语言的不确定性直接影响着自然语言处理领域的相关应用的实现,这说明词义消歧研究是解决自然语言处理的关键。让计算机依据从语料中提取出的语言学知识,自动地为歧义词匹配符合语境的词义是词义消歧的目的。
  本文针对本课题的研究的起源、意义和已有研究现状以及词义消歧未来将面临的挑战进行了介绍,并对比分析了主流词义消歧方法的优缺点。参考已有的相关知识和研究成果,提出一种结合统计学习理论的有监督的混合特征消歧方法。该方法结合语言学中常用的词法信息和语义类信息作为消歧特征。最后利用提取到的特征来训练分类模型,并测试该模型的消歧准确率。
  本文的研究内容主要体现为以下三个方面:
  其一,本文阐述了词义消歧领域中较为主流的消歧方法,并针对这些方法做出示例和比较。简述了词义消歧的评测体系和准确率的计算方式,以及词义消歧研究亟待解决的问题。
  其二,分析了词义消歧的语言学工程资源,包括语料的来源、语料格式、解析工具、语料标注体系、特征筛选和特征的提取。深入研究语料可提供的语言学知识有助于筛选出有益于消歧的特征。利用《同义词词林》获得词汇的语义类信息即语义代码,结合语义类和词法信息的特征提取方法,可以获取包括语义代码、词形和词性等语言学知识。其中,语义代码的多层知识结构可以提供不同层次的指导。
  其三,通过提取单一特征或不同特征信息的组合,构建有差异的特征向量集。分别利用这些差异化的特征向量集训练支持向量机分类器,然后对比多组不同特征向量集的实验结果,证明新方法及消歧分类器的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号