首页> 中文会议>第四届全国少数民族青年自然语言信息处理学术研讨会 >一种通用的少数民族语言语种和编码识别方法

一种通用的少数民族语言语种和编码识别方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

语种和编码识别是自然语言处理的基础环节.我国的一些少数民族语言有多种编码方式,增大了语种和编码识别的复杂性.本文提出了一种通用的基于统计的语种和编码识别方法,首先将编码粗识别为三类字符编码系列,然后结合三种粒度语言模型同时实现少数民族语言的语种和编码识别.该方法不依赖于各种少数民族语言特有的规则,便于扩展到新的语种和编码.实验结果表明,该方法对于维语、藏语、汉语、英语、阿拉伯语混合文本的语种和编码识别的准确率达99.95％以上,能够很好地完成少数民族语种和编码识别的任务.

著录项

来源
《第四届全国少数民族青年自然语言信息处理学术研讨会》|2012年|46-55|共10页
会议地点西宁
作者
Zhang Hai-bo; 张海波; Lü Ya-juan; 吕雅娟; Liu Kai; 刘凯; Hua Que-cai-rang; 华却才让; Liu Qun; 刘群;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
少数民族语言; 语种识别; 文字编码;
入库时间 2022-08-17 10:58:44

相似文献

中文文献
外文文献
专利

1. 中国少数民族语言信息资源跨语种共享策略研究 [J] . 赵生辉 . 图书馆建设 . 2014,第002期
2. 连续性资源编目研究——少数民族语言及小语种期刊罗马化书目数据制作 [J] . 崔明明 . 图书馆建设 . 2013,第004期
3. 多语种智能信息处理国际学术论坛——第13届中国少数民族语言文字信息处理学术研讨会征文通知 [J] . . 中文信息学报 . 2011,第2期
4. 中国少数民族语言电子文件的信息编码标准研究 [J] . 赵生辉 . 云南档案 . 2011,第009期
5. 通用语言、小语种语言与少数民族就业问题研究∗ [J] . 吕君奎 . 新疆大学学报（哲学·人文社会科学版） . 2013,第001期
6. 试论中国少数民族语言文字信息化问题(初稿)兼谈对政府如何发展少数民族语言文字信息产业的意见的建议 [C] . 苏雅拉图 . 1999年青岛-香港国际计算机会议 . 1999
7. 崖城军话研究——海南少数民族语言包围中一种近代官话的源与流 [A] . 刘春陶 . 2011

一种通用的少数民族语言语种和编码识别方法

摘要

著录项

相似文献

相关主题

期刊订阅