首页> 中文学位 >文本信息处理中汉语句法分析方法研究
【6h】

文本信息处理中汉语句法分析方法研究

代理获取

目录

文摘

英文文摘

独创性说明和大连理工大学学位论文版权使用授权书

1绪论

1.1问题的提出

1.2国内外研究现状

1.2.1问题背景与相关工作概述

1.2.2汉语句法分析面临的困难和常用的解决策略

1.2.3汉语句法分析研究的发展趋势和实际意义

1.3本文的研究思路以及研究工作

2汉语句法分析模型与分析算法

2.1汉语句法分析模型

2.1.1短语结构语法与乔姆斯基层次体系

2.1.2常用的统计语言学模型的比较

2.2线图(Chart)句法分析算法

2.3句法分析算法的改进

2.3.1自顶向下和自底向上分析算法

2.3.2自底向上与自顶向下相结合的分析算法

2.3.3改进算法的基本流程

3句法分析系统的分析、设计与实现

3.1系统的目标分析和功能要求

3.2系统模型结构的设计

3.3系统采用的关键技术

3.4系统的词法分析模块

3.4.1词库

3.4.2分词模块

3.4.3词性标注模块

3.5系统的句法分析模块

3.5.1句法分析模块的组成

3.5.2句法分析流程图

3.5.3句法分析模块的实现

4试验测试与分析

4.1试验环境

4.2试验数据

4.2.1词性和短语标记集

4.2.2语料库

4.2.3句型库和语法规则库

4.3测试结果与分析

4.3.1试验过程和结果

4.3.2试验结果分析

5结论与展望

5.1结论

5.2展望

参考文献

附录句型库和语法规则示例

攻读硕士学位期间发表学术论文情况

致 谢

展开▼

摘要

本文研究了文本信息处理中汉语句法分析方法,核心工作可以概括为以下三个方面: 1.对现有的一些句法分析算法和模型进行了比较、综合。在总结前人研究成果的基础上,对传统的汉语句法分析算法加以改进,采用了自底向上与自顶向下相结合的线图分析方法,提高了分析效率,也使得分析结果的准确率有一定的提高。 2.设计了一套常用的汉语句型库作为研究基础,根据实际应用,确定了一套词性标记集和短语标记集,并根据常用的句型,设计了一套基于上下文无关的语法规则库。 3.分析、设计和实现了一个汉语句法分析原型系统,实现了基于最大词长匹配算法的分词模块和基于相对频率训练的统计方法的词性标注模块;实现了基于改进的线图分析算法的句法分析模块。 本文使用北大计算语言研究所制作的PFR人民日报标注语料库作为训练样本,根据本文确定的词性标记集和短语标记集,以及本文设计的一套语法规则库,使用VC++6.0开发工具,实现了一个汉语句法分析原型系统,并进行小规模中文文本试验测试,验证本文改进的分析算法可行有效。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号