首页> 中文学位 >介词、连词用法在短语结构句法分析中的应用研究
【6h】

介词、连词用法在短语结构句法分析中的应用研究

代理获取

目录

声明

摘要

图表目录

1 引言

1.1 研究意义

1.2 研究背景

1.3 句法分析研究现状

1.3.1 国外研究现状

1.3.2 国内研究现状

1.4 研究内容

1.5 论文组织框架

2 介词用法自动识别

2.1 现代汉语介词用法知识库

2.1.1 介词用法词典

2.1.2 介词用法规则库

2.1.3 介词用法语料库

2.2 基于规则的介词用法自动识别

2.2.1 基于规则的介词用法自动识别方法

2.2.2 实验评价方法

2.2.3 实验结果与分析

2.3 基于统计的介词用法自动识别

2.3.1 统计模型介绍

2.3.2 特征抽取

2.3.3 实验结果与分析

2.4 本章小结

3 介词用法在短语结构句法分析中的应用

3.1 介词短语边界识别

3.1.1 基于规则的介词短语边界识别

3.1.2 基于统计的介词短语边界识别

3.2 介词用法在短语结构句法分析中的应用

3.2.1 方法描述

3.2.2 获得边界识别标准库

3.2.3 后处理方法

3.3 实验结果及分析

3.3.1 实验语料

3.3.2 实验评价指标

3.3.3 实验结果

3.4 本章小结

4 连词用法在短语结构句法分析中的应用

4.1 连词短语边界识别

4.1.1 基于规则的连词短语边界识别

4.1.2 基于统计的连词短语边界识别

4.2 连词用法在短语结构句法分析中的应用研究

4.2.1 方法描述

4.2.2 获得边界识别标准库

4.2.3 后处理方法

4.3 实验结果及分析

4.4 本章小结

5 结论与展望

5.1 结论

5.2 展望

参考文献

个人简历 在学期间发表的学术论文及研究成果

致谢

展开▼

摘要

中文句法分析是自然语言处理领域中的一个重要课题。针对汉语本身的特点,本文将介词用法融入到句法分析结果中,使用介词用法属性对StanfordParser进行后处理。首先,为了得到较高的介词用法自动识别结果,本文在已有的基于规则的介词用法自动标注方法的基础上,提出了基于统计的介词用法的自动标注方法,分别采用条件随机场、最大熵和支持向量机三种统计模型,以2000年2月、3月、4月《人民日报》分词与词性标注语料为实验语料,对常用介词进行了自动标注实验,实验结果表明基于统计的介词用法自动标注总体上优于基于规则的介词用法自动标注结果。其次,本文在StanfordParser分析结果的基础上,使用由介词用法属性特征得到的边界识别结果,对已有句法分析结果进行一定的修改,从而提高中文句法分析的准确率。实验表明,融入用法属性特征的句法分析结果比之前结果有了一定的提高。最后,为了验证基于介词用法的句法分析后处理方法的适用性,本文将此方法进一步运用到了连词中,且得到了较好的实验效果。
   本文主要的工作包括:
   (1)根据“三位一体”广义虚词知识库,在对基于规则的介词用法自动标注结果进行人工校对所得到的正确语料的基础上,实现了基于统计的介词用法自动标注。
   (2)在介词用法自动识别、基于用法的介词短语边界识别、StanfordParser及宾州中文树库的基础上,实现了介词用法在短语结构句法分析中的应用研究。
   (3)根据介词用法在短语结构句法分析中的应用研究,在连词用法自动识别、基于用法的连词短语边界识别的基础上,实现了连词用法在短语结构句法分析中的应用研究。
   最后,对本文的研究内容进行了总结,并根据研究结果对下一步工作做了展望,指出了下一步的研究方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号