首页> 中文学位 >面向信息处理的介词短语“往+X”的边界识别研究
【6h】

面向信息处理的介词短语“往+X”的边界识别研究

代理获取

目录

文摘

英文文摘

论文说明:主要符号表

声明

第一章绪论

1.1计算语言学方面的研究

1.1.1课题提出的理论背景

1.1.2前人关于短语识别的研究

1.2本体语言学方面的研究

1.3我们的研究

1.3.1本文的研究目标

1.3.2本文的研究方法

第二章介词短语“往+X”的右边界识别分析

2.1“X”为词时,对“X”右边界的初步分析

2.1.1“X”为方位词

2.1.2“X”为处所词

2.1.3“X”为代词

2.1.4“X”为形容词

2.1.5“X”为趋向动词

2.1.6“X”为普通名词

2.1.7“X”为地名

2.1.8“X”为机构名

2.2“X”为短语时,对“X”的右边界初步分析

2.2.1“X”为方位短语

2.2.2“X”为偏正短语

2.2.3“X”为联合短语

2.2.4“X”为量词短语

2.3小结

第三章介词短语“往+X”的右相关词“Y”的分析

3.1 右相关词“Y”的特征分析

3.1.1动 词

3.1.2形容词

3.1.3副 词

3.1.4数词

3.1.5连词

3.1.6介 词

3.1.7代词

3.1.8助 词

3.2“X”右边界标志词与右相关词“Y”的共现规律分析

3.2.1当“X”为名词或者偏正短语时,其右相关词“Y”的分析

3.2.2当“X”为形容词时,右相关词“Y”的分析

3.2.3当“X”为量词短语时,其右相关词“Y”的分析

3.3.小结

第四章基于VisualBasic的介词短语“往+X”的自动识别

4.1算法设计

4.2程序设计

4.3程序的不足之处分析

4.3.1关于语料的标注问题

4.3.2关于文本的识别问题

4.3.3关于两种格式识别难点的分析

4.4小结

第五章结 语

5.1本文研究总结

5.2进一步的研究计划

参考文献

致谢

攻读硕士学位期间取得的研究成果

展开▼

摘要

本文研究的目标是实现介词短语“往+X”在计算机中的自动识别,要实现这一目标,首先就是要让计算机能够自己确定介词短语“往+X”的左右边界,介词短语“往+X”的左边界是介词“往”,难点在于计算机无法确定它右边界的位置,所以本文的研究重点在于如何确定其右边界的位置。本文选择了2001年《作家文摘》和《人民日报》的语料作为本研究的基础,在对语料逐条标注的基础上进行分析,找到介词“往+X”右边界词的出现规律,再制定识别规则来识别短语。全文共分五章: 第一章:主要是从本体语言学和计算语言学两个方面对前人研究进行了概述,提出本研究的内容和目标。 第二章:主要对介词短语“往+X”的右边界的识别分析,根据我们的语料,把可以进入“X”的分成词和短语两种情况进行分析,对介词短语“往+X”的内部组合结构进行归纳,并且判断“X”的右边界标志词。 第三章:主要研究介词短语“往+X”的右相关词“Y”特征,由于“X”中隐性边界标志词很难识别,所以必须借助右相关词“Y”来帮助计算机识别。通过研究“X”的右边界和右相关词“Y”的共现特征,选择部分右相关词来帮助计算机识别。 第四章:基于VisualBasic的介词短语“往+X”的自动识别,根据对“X”和“Y”的分析,制定算法,运用VB语言进行程序设计,让计算机可以自动识别出介词短语“往+X”,并且进行一定数据的测试,找出算法设计上的不足。 第五章:结语部分是对本文的主要结论,研究目的,研究方法以及未来需要做的研究工作的说明。

著录项

  • 作者

    江艳;

  • 作者单位

    上海师范大学;

  • 授予单位 上海师范大学;
  • 学科 语言学及应用语言学
  • 授予学位 硕士
  • 导师姓名 任海波;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 句法;
  • 关键词

    介词短语; 往+X格式; 计算机; 自动识别;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号