首页> 中文学位 >基于词元语义特征的汉语框架排歧技术研究
【6h】

基于词元语义特征的汉语框架排歧技术研究

代理获取

目录

摘要

第一章 引言

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文的研究内容

1.4 论文的组织结构

第二章 框架排歧与汉语框架网语义资源

2.1 基本概念介绍

2.2 汉语框架网语义资源

2.3 框架排歧任务描述

2.4 本章小结

第三章 基于词元语义特征的汉语框架排歧模型

3.1 系统架构

3.2 模型选择

3.2.1 SVM模型

3.2.2 最大熵模型

3.3 实验设置

3.3.1 实验语料及预处理

3.3.2 实验评价指标

3.3.3 实验结果及分析

3.4 本章小结

第四章 基于词元语义特征汉语框架排歧的特征选择

4.1 人工特征选择

4.2 自动特征选择

4.3 实验设置

4.3.1 基于人工特征选择的汉语框架排歧实验结果及分析

4.3.2 基于自动特征选择的汉语框架排歧实验结果及分析

4.3.3 对比实验结果及分析

4.4 本章小结

第五章 结论与展望

5.1 结论

5.2 展望

参考文献

攻读学位期间取得的研究成果

致谢

个人简况及联系方式

承诺书

声明

展开▼

摘要

近年来,语义分析已经引起了自然语言处理领域越来越多的关注。随着SemEval2007任务Task19的提出,框架语义抽取任务受到了越来越多研究学者的关注。框架排歧任务是框架语义结构抽取任务中的子任务,作为中间环节,占有基础又重要的地位。目前常用的框架排歧方法是人工设定模型和特征模板,研究表明这种方法不能充分利用目标词所激起的框架的语义特征,因而,本文研究了基于语义特征的汉语框架排歧。框架排歧最重要的两个步骤就是模型选择和特征选择。针对模型选择,本文将汉语框架排歧看作是一个单点分类问题,考察了SVM模型和最大熵模型对汉语框架排歧的影响。针对特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的。为此,本文提出了自动特征选择算法,即为每个目标词自动选择一个特征模板。
   本文的主要研究内容与贡献包括:
   (1)基于词元语义特征的汉语框架排歧模型。分别阐述了SVM模型和最大熵模型,研究了这两种模型在词法层面和句法层面对汉语框架排歧性能的影响。实验结果表明,最大熵模型更适合汉语框架排歧。
   (2)基于词元语义特征的汉语框架排歧特征选择。使用最大熵模型,采用传统的人工特征选择方法和本文提出的自动特征选择方法进行汉语框架排歧。实验结果显示,自动特征选择方法在时间复杂度和空间度要明显优于人工特征选择方法,而且简化了特征模板。
   (3)使用most-frequent frame方法作为baseline实验,并与其他汉语框架排歧的文献结果进行对比分析。此外,从词法和句法层面验证了自动特征选择方法的有效性。
   本文在语料扩充的基础上,借助汉语框架网语义资源,利用词元的语义特征,为每个歧义目标词单独采用最大熵模型建模,并使用自动特征选择算法选出的特征模板,进行5-fold交叉验证,平均精确率可达到84.46%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号