首页> 中文学位 >面向三维场景生成的中文语义角色标注方法研究
【6h】

面向三维场景生成的中文语义角色标注方法研究

代理获取

目录

面向三维场景生成的中文语义角色标注方法研究

Research on Chinese Semantic Role LabelingMethod for 3D Scene Generation

摘要

Abstract

第1 章 绪论

1.1 课题背景及研究的目的和意义

1.2 国内外在该方向上的研究现状及分析

1.3 论文的主要研究内容

1.4 本文的组织结构

第2 章 语料库的构建与语义角色标注过程

2.1 《伊索寓言》语料库的构建

2.2 语义角色标注系统

2.3 本章小结

第3 章 基于最大熵模型的语义角色标注

3.1 待标注对象的确定

3.2 语义角色剪枝规则

3.3 识别和分类

3.4 特征空间

3.5 后处理规则

3.6 实验结果

3.7 实验结论

3.8 本章小结

第4 章 基于核函数的语义角色标注

4.1 支持向量机 (SVM)

4.2 核函数

4.3 从特征中构造核函数

4.4 实验结果

4.5 实验结论

4.6 本章小结

结论

参考文献

攻读学位期间发表的学术论文

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

展开▼

摘要

本课题来源于国家自然科学基金资助项目——“基于Ontology的文本中空间关系的三维可视化研究”(简称文景转换),该项目以基于Ontology的自然语言文本到相应的三维动态虚拟场景转换与生成机制为主要研究内容。由于动态场景需要以动作为线索,就必须首先应用自然语言处理技术,要全面地理解和提取文章中的动词信息。因此提出了面向该领域的语义角色标注的研究与实现。
  语义角色标注是语义分析的一种主要实现方式,采用“谓语-角色”的结构形式,标记句子中的成分作为给定谓语的语义角色,包括施事、受事、时间、地点等。在本文的语义角色的识别和分类中,主要采用两类学习方法:基于最大熵模型的统计机器学习方法;基于Kernel的学习方法。
  本文的主要研究内容:
  (1)介绍了目前用于本研究的《伊索寓言》语料库的构建,包括:动词在文章中出现频率的统计;动词的聚类;选择待标注单元;确定要标注的语义角色类型;确定待标注的典型动词;仿照CPB的标注形式完成标注。
  (2)给出了完整的中文语义角色标注系统的设计方案,主要包括5部分:预处理,自动标注,后处理,评价方法和对系统的改进策略。
  (3)详细描述了该领域内基于最大熵模型的语义角色标注系统的实现:以句法成分作为待标注单元;根据剪枝规则,删除大部分不可能是语义角色的节点;利用最大熵模型,对候选节点进行识别和分类。在基础特征空间上整体F值达到60.185%;在上述系统中加入扩展特征空间,整体F值达到61.027%。使用了后处理规则,整体F值提高到63.862%。
  (4)详细描述了该领域内基于Kernel的语义角色标注系统的实现:给出了一种从特征构造出来的核函数PAK,将PAK嵌入到libSVM中,在《伊索寓言》语料上对前述的六类论元进行识别和分类,得到整体的精确率为65.321%。为了测试PAK对于角色识别系统的贡献,增加了一组对比实验,利用SVM中的多项式核函数,在相同的语料上进行实验,得到整体的精确率为69.028%。显然,这两组实验的整体效果要超过基于最大熵模型中的利用特征的分类效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号