首页> 中文学位 >面向中文信息处理的汉语复句中书读短语的自动识别研究
【6h】

面向中文信息处理的汉语复句中书读短语的自动识别研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1论文的研究背景及意义

1.2国内外研究现状

1.2.1现有的句法分析研究

1.2.2现有的句法成分的标注研究

1.3本文的主要研究内容和方法

1.4论文的章节安排

第二章基于规则的复句书读短语的自动识别研究

2.1确定分句的影响因素

2.2书读短语的特征分析

2.2.1书读短语的性质

2.2.2本文识别的书读短语的范围

2.2.3书读短语的标记规范

2.3基于规则的书读短语自动识别整体结构图

2.4规则的设计和使用

2.4.1明显形式标记库的建立

2.4.2形式化规则库的建立

2.4.3基于规则的书读短语的自动识别标记

2.5本章小结

第三章基于可信度的书读短语的自动识别研究

3.1理论基础

3.2基于可信度的书读短语的自动识别过程

3.2.1基于可信度的书读短语自动识别的整体结构

3.2.2预处理

3.2.3特征的选取

3.2.4特征权值的计算

3.2.5待测语言片段的可信度计算

3.2.6实验结果

3.3本章小结

第四章基于聚类分析的书读短语自动识别研究

4.1聚类分析的理论基础

4.2聚类分析的准备

4.3聚类分析的过程

4.4基于聚类分析法的书读短语自动识别及实验结果

4.5本章小结

第五章全文总结与展望

5.1全文总结

5.2展望

附录

参考文献

攻读硕士学位期间发表的论文

致谢

展开▼

摘要

语料库语言学在1990年代得到迅速的发展。语料库语言学的要旨是让计算机从大规模真实文本语料中直接学习并自动处理语言信息。然而,原始语料的利用价值有限,如果在原始语料中预先加入一定的语言学知识,计算机就会自动获得更多的信息,并可以利用标注好的语料统计带词性的词频、同形异类词的分布等应用价值更高的数据。因此,深加工的语料库成为计算语言学的基础资源,而语料库的深加工技术也成为计算语言学的研究热点之一。 在中文信息处理方面,对于汉语信息的处理应该包括有字处理和词处理、句处理、篇章处理。到目前为止,基本上还停留在“字和词处理”阶段,大多数研究成果都是基于字和词的研究,对于句子的研究尤其是汉语复句的计算机处理相对较少,因此必须逐步实现“字和词处理

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号