首页> 中文学位 >基于句尾词性的藏语句子边界识别方法
【6h】

基于句尾词性的藏语句子边界识别方法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1研究背景及意义

1.2 研究现状

1.3 论文框架结构

第二章 语料库建设

2.1 语料库建设的意义及现状

2.1.1语料库建设的意义

2.1.2 语料库建设的现状

2.2 藏语语料库构建方法

2.2.1 从网站下载语料

2.2.2 将PDF转换为文本

第三章 句尾词性的藏语句子边界识别方法

3.1 藏语句子的特征分析

3.2 藏语句子边界识别方法

3.3 基于句尾词性的藏语分句系统

3.3.1 系统功能

3.3.2 系统使用说明

第四章 实验数据分析

4.1藏语句子边界识别实验

4.2 不同识别方法的结果比较

第五章 总结与展望

参考文献

致谢

个人简历

在学期间的研究成果及发表的学术论文清单

1 参加项目

2 发表学术论文

3 参加学术会议情况

4 软件著作权登记

展开▼

摘要

藏语自然语言处理是一门自然科学与社会科学的交叉学科,集藏语语言学、计算机科学、数学、逻辑学和心理学,研究人与人、人与计算机之间交流的一种语言问题。相对而言藏语自然语言处理研究起步较晚,刚开始的研究集中在藏文字的层面,较长的时间内停留在藏文字编码、字库建设和藏文字处理等研究上,随着国家与国际标准制订才得以确定。随着计算机技术和网络技术的迅猛发展,藏语自然语言处理得到了快速发展,近年来藏语自然语言处理的研究从字的层面逐步过渡到了词和句子的研究,开发了藏文分词系统和标注系统,统计出了藏文字、词的频度,取得了一系列创新性的研究成果。
  以上研究成果为藏语句子研究奠定了坚实的基础,目前已有科研单位及学者开始研究藏语句子的特点、属性、成分等,这些研究的前提是要能够确定藏语句子的边界。藏语句子边界识别研究技术比较成熟后才能够准确地研究藏语句子的特点、成分及句法分析。
  藏语句子边界识别研究对词法分析、句法分析、语义分析、语用分析及语料库建设等领域有着非常重要的理论价值。本文通过搜集和阅读大量的文献资料,分析了藏语句子的概念以及特性,统计分析了藏语句子的结束形式以及藏语句尾词性和藏语标点符号系统,研究了藏语句子边界的词性规则,提出了基于句尾词性的藏语句子边界识别方法。该方法简单有效,在含35126句的语料中随机抽取4133句作为测试集,对本文提出的识别方法进行了测试,其准确率达99.98%,召回率为99.98%,F1为0.9998。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号