基于词元语义特征的汉语框架排歧技术研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

近年来，语义分析已经引起了自然语言处理领域越来越多的关注。随着SemEval2007任务Task19的提出，框架语义抽取任务受到了越来越多研究学者的关注。框架排歧任务是框架语义结构抽取任务中的子任务，作为中间环节，占有基础又重要的地位。目前常用的框架排歧方法是人工设定模型和特征模板，研究表明这种方法不能充分利用目标词所激起的框架的语义特征，因而，本文研究了基于语义特征的汉语框架排歧。框架排歧最重要的两个步骤就是模型选择和特征选择。针对模型选择，本文将汉语框架排歧看作是一个单点分类问题，考察了SVM模型和最大熵模型对汉语框架排歧的影响。针对特征选择，目前常用的方法是人工特征选择方法，但是这种方法不能有效地利用每个目标词的语义特征，而且大量实验表明，不同的目标词取得最好的结果时所用的特征模板是不同的。为此，本文提出了自动特征选择算法，即为每个目标词自动选择一个特征模板。
　　本文的主要研究内容与贡献包括:
　　 (1)基于词元语义特征的汉语框架排歧模型。分别阐述了SVM模型和最大熵模型，研究了这两种模型在词法层面和句法层面对汉语框架排歧性能的影响。实验结果表明，最大熵模型更适合汉语框架排歧。
　　 (2)基于词元语义特征的汉语框架排歧特征选择。使用最大熵模型，采用传统的人工特征选择方法和本文提出的自动特征选择方法进行汉语框架排歧。实验结果显示，自动特征选择方法在时间复杂度和空间度要明显优于人工特征选择方法，而且简化了特征模板。
　　 (3)使用most-frequent frame方法作为baseline实验，并与其他汉语框架排歧的文献结果进行对比分析。此外，从词法和句法层面验证了自动特征选择方法的有效性。
　　本文在语料扩充的基础上，借助汉语框架网语义资源，利用词元的语义特征，为每个歧义目标词单独采用最大熵模型建模，并使用自动特征选择算法选出的特征模板，进行5-fold交叉验证，平均精确率可达到84.46％。

著录项

作者
张立凡;
展开▼
作者单位

山西大学;

展开▼
授予单位山西大学;
学科计算机软件与理论
授予学位硕士
导师姓名张国臣;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
汉语框架排歧; 语义资源; 自动特征选择; 词元语义特征;

相似文献

中文文献
外文文献
专利

1. 基于词元语义特征的汉语框架排歧研究 [J] . 李国臣 ,张立凡 ,李茹 . 中文信息学报 . 2013,第004期
2. 基于框架表示学习的汉语框架排歧 [J] . 侯运瑶 ,曹学飞 ,崔军 . 计算机应用研究 . 2020,第012期
3. 基于词分布式表征的汉语框架排歧模型 [J] . 张力文 ,王瑞波 ,李茹 . 中文信息学报 . 2017,第006期
4. 基于词分布表征的汉语框架排歧研究 [J] . 党帅兵 ,李国臣 ,王瑞波 . 中北大学学报（自然科学版） . 2015,第003期
5. 基于汉语短语结构歧义的蒙太格型语义排歧 [J] . 陈晓华 . 湘潭师范学院学报（社会科学版） . 2007,第004期
6. 基于词分布式表征的汉语框架排歧模型 [C] . 张力文 ,王瑞波 ,李茹 . 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 . 2017
7. 基于框架表示学习的汉语框架排歧研究 [A] . 侯运瑶 . 2020

基于词元语义特征的汉语框架排歧技术研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅