首页> 中文学位 >中文子句语义角色标注系统实现研究
【6h】

中文子句语义角色标注系统实现研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1语义分析任务概述

1.2语义角色标注研究方法

1.3半监督算法

1.4研究工作概述

1.5论文组织结构

第二章中文单VP子句语义角色标注

2.1半监督语义角色标注系统

2.1.1谓词及其论元块识别

2.1.2候选角色削减

2.1.3角色预测概率模型

2.2实验资源详述

2.2.1实验所用中文单谓词子句

2.2.2中文语义角色集

2.2.3动词词典

2.2.4名词词典

2.3实验结果及分析

2.3.1实验1

2.3.2实验2

2.3.3实验3

第三章中文双VP子句组块分析

3.1工作背景及问题提出

3.2汉语组块问题

3.2.1汉语组块的定义

3.2.2汉语组块识别技术

3.3多谓词子句回退算法

3.3.1句式分析

3.3.2句式自动分类

3.4实验资源详述

3.4.1CTB语料库

3.4.2影评测试语料

3.5实验结果及分析

3.5.1句式分析结果

3.5.2CTB5.1上句式自动分类结果

3.5.3影评测试语料上的自动分类结果

第四章中文双VP子句的语义角色标注

4.1标注方法

4.1.1主谓词及相关论元块识别

4.1.2双谓词子句的语义角色标注

4.2实验资源详述

4.3实验结果及分析

4.3.1实验1

4.3.2实验2

4.3.3实验3

第五章工作总结及展望

参考文献

致谢

作者攻读学位期间发表的学术论文目录

展开▼

摘要

近年来,大量的研究开始关注浅层语义分析,也就是语义角色标注(SRL)。中文语义级手工标注语料的稀缺,以及中文句子结构的复杂性,都成为中文语与角色标注任务面临的重要问题。然而,目前较少有中文语义分析相关研究来解决这些问题。在本论文中,我们将给出第一个中文语义角色标注系统的全方面性能结果。而只利用了一小部分的已标注语料以及大部分的未标注语料。 已有的语义角色标注系统都直接面对语料库中的所有句子进行处理,我们的系统则被设计为只处理单VP中文子句(只含有一个动词短语的子句)。含有多于一个动词短语的子句会被转换成单VP子句的句式形式,使得可以被我们的语义角色标注系统处理。该系统处理单VP子句的性能被作为系统的基本性能。当处理复杂中文子句时(也即我们所说的多VP子句),很难识别子句中的主谓词以及其相关的(尤其是较大的)功能块,于是语义角色标注系统的性能将会因此而严重恶化。作者在该论文中提出了一个新颖的方法,来替换对于多VP子句组块的自动组块器。通过这种方法,多VP子句将被较好的转化成单VP子句的形式,从而被语义角色标注系统处理。在论文中将会证明,转化后的多VP子句的语义角色标注性能与单VP子句标注的基本性能十分相近。 作者关于建立了一个完整的半监督语义角色标注系统的工作,将对未来中文语义分析工作起到很大的帮助作用。对于该系统的细节描述以及实验分析结果将在本论文中--给出。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号