基于统计专用字符的维、哈、柯文文种识别研究

买买提依明·哈斯木; 吾守尔·斯拉木; 维尼拉·木沙江; 努尔麦麦提·尤鲁瓦斯

首页> 中文期刊>中文信息学报 >基于统计专用字符的维、哈、柯文文种识别研究

基于统计专用字符的维、哈、柯文文种识别研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在Unicode编码方案中维、哈、柯文字符安排在阿拉伯字符区域,三种语言中共享字符比较多,跟阿拉伯字符区域混在一起,没有专用的语言ID.在信息检索和自然语言处理领域对维、哈、柯文的识别、处理带来不便.该文首先分析并总结了维、哈、柯文三种语言中的专用字符、复合字符、某些字符在某种语言中出现形势的独特性等特征,然后在此基础上设计了维、哈、柯文种识别算法.实验结果表明该文提出的文种识别算法的正确率在文本多于70词时达到96.67％以上.

著录项

来源
《中文信息学报》|2015年第2期|111-117|共7页
作者
买买提依明·哈斯木; 吾守尔·斯拉木; 维尼拉·木沙江; 努尔麦麦提·尤鲁瓦斯;
展开▼
作者单位

新疆大学信息科学与工程学院,新疆多语种重点实验室,新疆乌鲁木齐830046;

和田师范专科学校,计算机科学系,新疆和田848000;

新疆大学信息科学与工程学院,新疆多语种重点实验室,新疆乌鲁木齐830046;

新疆大学信息科学与工程学院,新疆多语种重点实验室,新疆乌鲁木齐830046;

新疆大学信息科学与工程学院,新疆多语种重点实验室,新疆乌鲁木齐830046;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
文种识别; 专用字符; 复合字符; 维文; 哈文; 柯文; Unicode;
入库时间 2022-08-18 06:08:23

相似文献

中文文献
外文文献
专利

1. 基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究 [J] . 维尼拉·木沙江 ,吐尔地·托合提 ,吐尔洪·吾司曼 . 郑州大学学报（理学版） . 2009,第001期
2. 基于维哈柯文非安全文档识别的哈希数据库系统设计 [J] . 王亚娟 ,于丽 ,亚森·艾则孜 . 电脑编程技巧与维护 . 2015,第023期
3. 基于轮廓结构和统计特征的字符识别研究 [J] . 贾婧 ,葛万成 ,陈康力 . 沈阳师范大学学报（自然科学版） . 2006,第001期
4. 基于统计的车牌字符识别 [J] . 肖雄 ,黄樟灿 . 数字技术与应用 . 2016,第004期
5. 基于统计的车牌字符识别 [J] . 肖雄 ,黄樟灿 . 数字技术与应用 . 2016,第004期
6. 基于单个字符的文种鉴别研究 [C] . YE Hao ,叶浩 ,PENG Liangrui . “文字与信息”学术研讨会 . 2012
7. 基于中亚多文种文档图像的文种识别技术研究 [A] . 布阿加姑丽·米吉提 . 2017

基于统计专用字符的维、哈、柯文文种识别研究

摘要

著录项

相似文献

相关主题

期刊订阅