首页> 中文学位 >基于标记隐现规则和关联特征的复句层次结构分析研究
【6h】

基于标记隐现规则和关联特征的复句层次结构分析研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 研究现状

1.3 研究难点与创新

1.4 论文目标与内容

1.5 论文组织与结构

第二章 汉语复句的相关概述

2.1 依存句法

2.2 复句分类

2.2.1 关系分类

2.2.2 非关系分类

2.3 复句内的关系标记

2.4 复句层次结构概述

2.5 本章小结

第三章 复句内标记隐现模式的挖掘

3.1 基于依存句法和标点符号的分句划分

3.1.1 标点对分句划分的影响

3.1.2 伪分句

3.1.3 分句划分

3.2 标记隐现模式挖掘

3.2.1 标记隐现模式定义

3.2.2 标记配位类型表

3.2.3 引入A*思想的标记隐现模式提取

3.3 标记隐现规则的构建

3.4 本章小结

第四章 基于依存句法的分句关联特征提取

4.1 关联特征分类

4.1.1 形式特征

4.1.2 语义特征

4.2 关联特征的提取

4.2.1 关联度的描述

4.2.2 特征提取流程

4.3 关联度计算

4.4 本章小结

第五章 基于标记隐现和关联特征的复句层次结构分析

5.1 有标复句层次结构的人工识别方法

5.2 有标复句层次结构分析的自动化框架

5.2.1 充盈态有标复句层次结构分析

5.2.2 非充盈态有标复句层次结构分析

5.3 实验语料准备

5.4 实验结果与分析

5.4.1 实验结果

5.4.2 实验分析

5.5 本章小结

6.1 总结

6.2 展望

参考文献

攻读硕士期间参加的科研项目和发表的论文

致谢

展开▼

摘要

中文信息处理作为计算语言学的一个分支,在人工智能、搜索引擎等互联网技术飞速发展的今天显得越来越重要。汉语的使用范围也随着中国在国际上的影响力逐渐扩大,而汉语复句作为汉语语言的重要组成部分,已经成为计算机解决的核心对象,也是目前中文信息处理的研究难点之一。
  目前,对复句的研究主要包括关系标记的自动标识、分句和非分句的判断、复句层次的自动划分和复句关系的识别。其中,关系标记的自动标识和分句划分已经有了较多的研究,而复句层次的自动划分和关系识别研究较少。
  鉴于关系标记的自动标识技术已经基本成熟,且关系标记本身具有标明复句层次结构和分句间逻辑语义的作用,因此,在对复句的层次结构进行分析时也要紧紧抓住关系标记这一重要形式标志。然而,由于汉语表达方式的多样性,分句内总会出现关系标记的缺省,即关系标记的隐现,这就导致仅仅依靠关系标记实现复句层次的识别困难重重。为此,本文采取“分而治之”的策略,将研究对象(三句式有标复句)分成充盈态和非充盈态两种类型;同时,为解决标记缺省的问题,构建了标记配位类型表和标记隐现规则,实现对复句内的标记隐现模式的自动提取;另外,在复句的依存句法分析基础上,提出了利用句法成分复现进行分句间关联度的计算。最终通过构建基于标记隐现规则和关联特征的复句层次结构识别模型,达到对复句的层次结构进行自动划分的目的。
  本文的工作从以下几个方面开展。首先,本文利用依存句法和标点符号对复句内的分句进行划分;其次,在剔除伪分句的基础上,对分句内的关系标记进行标注和提取,以期获得复句的关系标记序列;然后,构建标记配位类型表,并在此基础上提出了标记隐现模式确定算法,获得给定复句的标记隐现模式;同时,在依存句法分析的基础上,提出利用句法成分复现对分句间的关联度进行计算的方法;最后,构建基于标记隐现规则和关联特征进行复句层次结构判断的模型,通过标记隐现规则对充盈态三句式有标复句的层次进行识别和分析,对于非充盈态三句式有标复句则利用关联特征进行层次结构判断。通过实验,标记隐现模式获得的正确率达91.5%,复句层次结构分析的正确率达90.6%。该结果表明,本文提出的方法对复句层次结构的分析是行之有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号