基于音节标注的藏文自动分词研究

何向真; 李亚超; 马宁; 于洪志

首页> 中文期刊>计算机应用研究 >基于音节标注的藏文自动分词研究

基于音节标注的藏文自动分词研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

分词是藏文信息处理的基础性关键问题,是把连续的藏文音节序列组合成词序列的过程.针对藏文分词中的特殊问题,把藏文分词问题看成判断音节在词中的位置过程,分别实现了基于最大熵、条件随机场、最大间隔Markov网络模型等模型下的分词系统,并在同等条件下进行了实验对比.实验结果表明,在当前四字位的标注集下,基于条件随机场的藏文分词系统取得了最好的分词结果,同时其他序列标注模型也取得了较好的效果,说明基于音节标注的分词方法可以较为有效地处理藏文分词问题.

著录项

来源
《计算机应用研究》|2015年第7期|1989-1991|共3页
作者
何向真; 李亚超; 马宁; 于洪志;
展开▼
作者单位

西北民族大学中国民族语言文字信息技术重点实验室,兰州730030;

西北民族大学中国民族语言文字信息技术重点实验室,兰州730030;

西北民族大学中国民族语言文字信息技术重点实验室,兰州730030;

西北民族大学中国民族语言文字信息技术重点实验室,兰州730030;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
藏文; 分词; 序列标注; 最大熵; 条件随机场; 最大间隔Markov网络模型;

相似文献

中文文献
外文文献
专利

1. 融合音节特征的最大熵藏文词性标注研究 [J] . 于洪志 ,李亚超 ,汪昆 . 中文信息学报 . 2013,第005期
2. 基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计及其应用研究 [J] . 卢亚军 ,马少平 ,张敏 . 西北民族大学学报（自然科学版） . 2003,第002期
3. 基于小字符集的藏文自动分词技术研究 [J] . 才华 . 西藏大学学报（自然科学版） . 2013,第002期
4. 基于有限状态自动机的藏文音节组织研究 [J] . 更桑吉 ,安见才让 . 计算机时代 . 2021,第001期
5. 基于规则的现代藏文音节字检错研究 [J] . 才让叁智 ,关白 . 西藏大学学报（自然科学版） . 2017,第001期
6. 基于格助词和接续特征的藏文自动分词方案 [C] . 陈玉忠 ,李保利 ,俞士汶 . 第一届学生计算语言学研讨会 . 2002
7. 基于音节切分的藏文乌金印刷体识别技术研究 [A] . 才让当知 . 2020

基于音节标注的藏文自动分词研究

摘要

著录项

相似文献

相关主题

期刊订阅