首页> 中文期刊> 《计算机应用与软件》 >用于构建维吾尔文语料库的中文件格式转换技术研究

用于构建维吾尔文语料库的中文件格式转换技术研究

     

摘要

研究在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊、杂志中获得维吾尔语单词,并转换到Windows环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法.实践证明这种方法有助于提高语料库构造中的大量单词收集的效率和质量.%In this paper we mainly study the fast solution for constructing Uighur text corpus. In the process of construction, the Uyghur language words are captured from books and magazines typeset in MS-DOS system and then converted to RTF format in WINDOWS environment. Then we put forward the RTF code generation timers corresponding to Unicode code of Uygur characters and a simple method of dynamic generation of Uyghur RTF files. Practice proves that this kind of method helps the improvement of efficiency and quality of the collection of a great amount of words during the construction of corpus.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号