首页> 中文学位 >面向信息处理的介词结构“以+X”的边界识别分析
【6h】

面向信息处理的介词结构“以+X”的边界识别分析

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究目标的确定

1.1.1介词

1.1.2介词结构

1.1.3介词结构的边界以及介词结构边界的识别

1.1.4介词“以”和介词结构“以+X”

1.1.5介词结构“以+X”的边界及其边界的识别

1.2研究意义

1.2.1自动句法分析的意义

1.2.2短语自动识别的意义

1.2.3介词短语边界识别的意义

1.2.4选取个案“以+X”进行边界识别的意义

1.3国内外相关研究以及存在的问题

1.3.1国内外对句法自动分析的研究

1.3.2国内外对短语自动识别的研究

1.3.3国内外对介词短语自动识别的研究

1.3.4对前人成果的借鉴以及需要突破的问题

1.4本文的组织

第二章研究基础与研究方法

2.1语料的构成及其来源

2.2语料的处理与分析

2.3“以”的词性与识别范围

2.3.1“V+以”结构中“以”的词性问题

2.3.2介词“以”的连、介区分问题

2.4相关概念的解释

2.4.1内相关词和外相关词

2.4.2准子句

2.5介词结构“以+V”自动识别的方法

2.5.1最大概率配对原理

2.5.2共性规律和个性知识相结合的原则

第三章“以+X”的结构及其相关因素分析

3.1“X”的语法类型

3.1.1能进入“X”的位置的词类

3.1.2“X”结构的规模

3.2“X”的语义特征

3.2.1指明动作、行为所凭借的事物

3.2.2指明动作、行为的状态

3.2.3指明动作、行为的根据、范围

3.2.4指明动作、行为的立场、角度

3.2.5指明动作、行为或状态产生的原因

3.2.6指明动词的受事(涉及对象)

3.3“以+X”后的“(B)Y”

3.3.1介词“以”和Y中的外相关词B组成的固定结构

3.3.2介词结构“以+X”和其他介词短语的连用

3.4“以+X”前的W

3.4.1 V为单音节动词+宾语“之”+以+X

3.4.2 V为单音节动词+以+X

3.4.3给予性动词+宾语+以+X

第四章自动识别的算法设计

4.1总体思路

4.2具体识别策略

4.3介词短语“以+X”边界识别的操作步骤

4.4小结

第五章分析结果及疑难问题

5.1研究结果

5.2疑难问题归纳分析

5.2.1规则下的例外

5.2.2联合介词结构导致标注错误

5.2.3两个或两个以上介词结构“以+X”嵌套,造成标注错误

5.2.4介词短语“以+X”超越准字句的范围,造成标注错误

5.2.5由语料本身词性标注错误所引发的错误

5.3小結

第六结语

6.1本文的特点

6.2本文所要达到的目的

6.3在本研究的过程中,我们主要使用的方法

6.4“以+X”自动标注研究给我们的启示和尚需解决的问题

参考文献

附录:

后记

展开▼

摘要

句法自动分析是自然语言理解的核心,是当前计算语言学研究的重点所在。现代汉语句法自动分析的主要内容是对各种短语进行自动标注和研究它们的句法功能。介词结构无论从定量角度,还是从定性角度,都是现代汉语中一种重要的语法结构。介词的个体特点也很明显,所以我们有条件也有必要对每个介词的边界识别进行研究,在个体分析基础上组成一个完整的介词短语边界识别系统。 本文我们选择介词“以”作为研究对象。“以”在古汉语中就是仅次于“于”的介词,在现代汉语中也是一个很常用的介词,作为介词的用法有很长的历史,具有介词分析的典型性,而且具体来研究“以+X”的结构,发现它又是一种很富有个性的介词短语,它在句法、语义和组合格式上都很有自己的特点和个性。 本文以自动识别为目的对介词结构“以+X”的边界识别进行个案分析。对介词短语“以+X”的内部结构特征进行了细致的描写,通过分析线性序列“W+以+X(A)+(B)Y”,尝试在语法、语义的基础上归纳总结出人工识别规则若干。一方面给汉语语法的本体研究以补充和完善,另一方面,当然也是更为重要的,它是计算语言学所需要的知识积累。 我们根据对介词结构“以+X”语法、语义的形式化描写,编写相应识别规则来进行自动识别的算法设计,这部分是本文的重点所在。在4000句语料的基础上,进一步将语料扩大到8000句,经过逐字逐句的人工标注,生成了几个数据表,并初步形成了我们识别的总体思路。 本文设计出自介词结构“以+X”的边界自动识别的算法,这个是中文信息处理这个大工程中的一个小细节。一方面可以为这个工程提供我们的研究成果,尤其是可以为其他介词的边界识别以及动词性短语结构的研究提供启示;另一方面我们在研究中所使用的方法和识别的思路,可以为以后的识别研究提供借鉴。 在文章最后,我们利用人工分析的方法来检测本文的研究成果,并对疑难问题类型进行了归纳分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号