首页> 中文学位 >基于主动学习的汉语框架语义角色标注
【6h】

基于主动学习的汉语框架语义角色标注

代理获取

目录

封面

目录

中文摘要

英文摘要

第一章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 本文研究内容及章节安排

第二章 相关概念及任务描述

2.1 基本概念介绍

2.2 汉语框架网语义资源

2.3框架语义角色标注任务描述

2.4 本章小结

第三章 基于路径的汉语框架语义角色标注

3.1 条件随机场

3.2特征选取及模板设置

3.3 本章小结

第四章 基于主动学习的汉语框架语义角色标注

4.1 引言

4.2 主动学习研究现状

4.3 基于置信度判别的主动学习算法

4.4 置信度判别准则

4.4本章小结

第五章 实验与结果分析

5.1 实验语料来源与预处理

5.2 基于路径的汉语框架语义角色标注

5.3基于主动学习的汉语框架语义角色标注

5.4 本章小结

第六章 总结与展望

参考文献

攻读学位期间取得的研究成果

致谢

个人简况及联系方式

承 诺 书

声明

展开▼

摘要

语义角色标注是自然语言处理研究领域的的一个关键问题,备受专家学者关注。作为浅层语义分析的一种实现方式,如能将其有效解决,可直接服务于自动问答、机器翻译、信息抽取等其他自然语言处理领域的相关任务。本文借助汉语框架网语义知识资源,研究了汉语框架语义角色标注,即采用条件随机场模型,针对特征选择问题首次引入依存路径从而有效增加了标注模型召回率,并在此基础上应用主动学习到汉语框架句子库的构建中。
  目前框架语义角色标注的研究以有监督的机器学习方法为主,因此需要一定规模且人工标注质量较高的例句作为训练语料,而现阶段汉语框架句子资源相对较少,而人工标注例句代价高,需要较多人力成本,所以本文引入主动学习的方法来降低汉语框架句子库的构建成本。
  本文首次在汉语框架语义角色标注中加入路径特征,提出并分析了不同路径对标注结果的影响作用。然后在汉语框架句子库和最优特征的基础上介绍了如何将主动学习应用到汉语框架句子库的构建中,从而达到降低构建框架句子库的人力成本和提高汉语框架语义角色标注性能的双重目的。本文主动学习采用不确定性抽样和委员会投票两种不同的判定置信度的方法并与被动学习做对比试验。该方法优先选择当前框架元素标注模型预测最不准(即置信度最低)的例句交由人工标注,以期使框架元素标注模型达到同等结果只需要标注更少的训练例句。本文针对判定置信度的方法提出并比较了权衡框架元素标注模型预测可信度的四种规则。
  实验结果表明,一以特征角度作为切入点的一级路径特征的加入,有效增加了汉语框架语义角色标注的召回率,而召回率的提高对发挥主动学习的作用有重要作用。二以语料为出发点的主动学习判定置信度的方法中,不确定性比委员会投票的方法更简单有效,但两者相比被动学习方法都获取了更好的结果。首先它使汉语框架语义角色标注在达到同等结果时最多可减少百分之三十的人工标注量;其次与被动学习随机选择例句标注相比,当使用相同数量的训练例句时,主动学习比被动学习的汉语框架语义角色标注性能有较大提高,性能最高提升5.07个百分点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号