首页> 中文期刊>中文信息学报 >一种改进的哈萨克文编码字符处理方法

一种改进的哈萨克文编码字符处理方法

     

摘要

该文介绍了哈萨克文专用字母()、()、()的特殊书写习惯,以及哈萨克文编码字符处理现状.指出当前广泛使用的字母替换法不符合国际和国家相关标准,并且会导致哈萨克文排序错误,增加文字转换 、语音合成等功能的实现难度.为解决上述不足,对字母替换法进行了三个改进,包括用专用字母与符号"()"结合表示它们自己;专用字母各种书写形式带符号()的字形中,仅将独立字符形式带符号"()"的字形包含在OpenType字体中;用字形替换规则识别专用字母与哈萨克文字母不相邻的上下文环境.为便于改进方法的应用,该文介绍了与改进方法一致的OpenType字体字形替换规则设置方法.%This paper describes the special writing rules of the Kazakh letters()、() and(),pointing out the current substitution method does not comply with international or national standards and obstructs Kazakh processing in text sorting ,script conversion and speech synthesis.This paper proposed three improvements ,i .e .1) representing the four special letters with the combination of themselves and character ;2) include only isolated forms with in OpenType font ;and 3) identifying the contexts that are not adjacent to the Kazakh letter based on the glyph substi -tute rule < calt > in OpenType font .To facilitate the application of the above suggestions ,this paper describes the set of the glyph substitution rules in OpenType font which is consistent with the improved method .

著录项

  • 来源
    《中文信息学报》|2017年第4期|94-99|共6页
  • 作者单位

    中国科学院 新疆理化技术研究所,新疆 乌鲁木齐 830011;

    中国科学院大学,北京 100049;

    新疆民族语音语言信息处理实验室,新疆 乌鲁木齐 830011;

    中国科学院 新疆理化技术研究所,新疆 乌鲁木齐 830011;

    新疆民族语音语言信息处理实验室,新疆 乌鲁木齐 830011;

    中国科学院 新疆理化技术研究所,新疆 乌鲁木齐 830011;

    中国科学院大学,北京 100049;

    新疆民族语音语言信息处理实验室,新疆 乌鲁木齐 830011;

    中国科学院 新疆理化技术研究所,新疆 乌鲁木齐 830011;

    新疆民族语音语言信息处理实验室,新疆 乌鲁木齐 830011;

    中国科学院 新疆理化技术研究所,新疆 乌鲁木齐 830011;

    中国科学院大学,北京 100049;

    新疆财经大学 计算机科学与工程学院,新疆 乌鲁木齐 830012;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    哈萨克文; 编码字符; Unicode; OpenType;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号