首页> 中文学位 >基于规则与BP神经网络相结合的复句关系词切分消歧
【6h】

基于规则与BP神经网络相结合的复句关系词切分消歧

代理获取

目录

声明

摘要

第一章 绪论

1.1 选题的背景及研究意义

1.2 研究现状

1.3 研究难点

1.4 研究内容与创新

第二章 汉语复句语料库的预处理

2.1 复句关系词的分析

2.2 复句语料库的预处理

2.2.1 复句语料库介绍

2.2.2 复句标注语料库的结构设计

2.3 汉语复句关系词序列的提取流程

2.3.1 辅助软件的构建

2.3.2 关系词的自动识别流程

2.4 本章小结

第三章 基于规则的复句关系词切分歧义消歧

3.1 复句关系词识别中规则的约束条件

3.1.1 复句关系词的相关定义

3.1.2 复句关系词规则的约束条件

3.1.3 复句关系词切分歧义字段的特征分析

3.2 关系词识别的规则表示方法

3.2.1 切分歧义字段的存在形式

3.2.2 规则的建立及其表示

3.3 切分歧义字段的自动识别及消歧

3.3.1 切分歧义字段识别流程及消歧过程

3.3.2 实验结果及分析

3.4 本章小结

第四章 BP神经网络的复句关系词切分歧义的词性标注

4.1 BP神经网络模型及词向量

4.1.1 BP神经网络模型简介

4.1.2 词向量及其表达

4.1.3 词性特征及约束

4.2 建立神经网络词性标注模型

4.2.1 词性标注问题说明

4.2.2 词性特征提取

4.2.3 神经网络的处理过程

4.2.4 词特征向量化

4.3 切分歧义字段消歧的整体框架

4.4 本章小结

第五章 实验结果与分析

5.1 复句语料介绍

5.2 实验处理过程

5.3 实验的结果和分析

5.4 本章小结

6.1 全文总结

6.2 工作展望

参考文献

在校期间参加的科研项目

致谢

展开▼

摘要

复句关系词是连接复句分句的桥梁,是研究汉语复句的切入点。对复句关系词自动识别的前提是对汉语复句进行正确的分词,而复句关系词切分消歧是复句关系词自动识别的基础。目前使用的分词系统在对汉语复句进行分词以及词性标注过程中存在着很多错误,给关系词识别造成困难。本文的主要目的是针对复句关系词与其他词切分在一起的情况进行研究,对歧义字段进行重新分词,并对分词后的结果进行词性标注,从而完成对切分歧义字段的消歧。
  文章首先对通过中科院的分词系统NLPIR对复句语料进行分词处理,并对六句式以下的复句语料进行关系词标注以及提取。在提取过程中,对复句语料分词后的结果进行分析,总结出复句关系词切分歧义字段的规律。然后,对关系词与其他词切分在一起的情况进行研究,并对其复句语料进行提取,根据这些复句关系词的特征建立规则,利用关系词本体库以及规则检索出切分歧义字段并对其进行正确切分。最后,通过构建BP神经网络模型,对模型进行训练,提取切分歧义字段的上下文语境词的词性特征以及对词的词性权重进行向量化,映射到神经网络的节点中。通过将误差与期望值的比较,并将误差反传,从而得到合适的权重,实现对词的词性进行标注,达到消歧的目的。
  在实验过程中,我们选取了七个比较常见的复句关系词,并从CCCS复句语料库提取条复句语料进行测试,切分歧义字段消歧的正确率达到93.4%,从而验证了基于规则与BP神经网络相结合的方法对复句关系词切分消歧的处理是有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号