首页> 中文学位 >维吾尔中介语语料库管理系统建设及自动标注技术研究
【6h】

维吾尔中介语语料库管理系统建设及自动标注技术研究

代理获取

目录

声明

论文说明

摘要

第1章 绪论

1.1 课题来源

1.2 选题背景

1.3 选题意义

1.4 国内外研究现状

1.5 维吾尔文知识

1.6 本文研究内容

1.7 论文的主要内容和组织结构

第2章 维吾尔中介语语料库构建

2.1 维吾尔中介语语料库规划

2.2 维吾尔中介语语料库标注规范

2.3 维吾尔中介语语料采集

2.4 维吾尔中介语语料库系统的实现

2.5 维吾尔中介语语料库系统的使用与维护

2.6 本章小结

第3章 维吾尔中介语语料库管理系统设计和实现

3.1 维吾尔中介语语料库系统特点

3.2 维吾尔中介语语料库系统工作流程

3.3 维吾尔中介语语料库系统数据库设计

3.4 维吾尔中介语语料库系统模块结构

3.5 本章小结

第4章 偏误自动标注技术研究

4.1 基本原理

4.2 人工标注的缺陷

4.3 偏误词典库与字符串匹配实现的自动标注

4.4 语言模型训练实现的自动标注

4.5 本章小结

第5章 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

发表论文与参与科研情况

个人简介

展开▼

摘要

语料库在建设的过程中是一个浩大的工程。在针对已经建立好的一些语料库和中介语语料库中伴随的大量研究成果充分证明了它的重要性。构建过程中还需要不同层次专业人员的参与。因此维吾尔中介语语料库系统的实现,对提高维吾尔语教学质量及维吾尔语专业人才培养质量有深远的影响。
  本系统主要从三个方面进行了设计与研究:第一、针对维吾尔中介语语料库的构建提出了总体规划,包括对标注代码设计,数据采集的内容与范围进行了分析和采集;第二、利用基于Java EE设计开发了维吾尔中介语语料库管理系统,解决了维文、数字、英文字母与符号混排时格式错误问题,设计了维文JS输入包,用户无需安装第三方维文输入法,可以在本系统直接输入维文,顺利地完成对中介语语料的录入、审核、标注和检索等工作;第三、由于采集回来的语料信息繁多,在标注过程中需要人工进行标注,工作量巨大。为此,利用了两种方法对自动标注技术进行了研究,两种方法分别为:偏误词典库与字符串匹配的方法和语言模型训练的方法。
  目前,维吾尔中介语语料库系统经测试后已经开始投入使用,对自动标注方法也已经进行了测试,达到预期的目标。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号