基于判别式分类和重排序技术的藏文分词

孙萌; 华却才让; 才智杰; 姜文斌; 吕雅娟; 刘群

首页> 中文期刊>中文信息学报 >基于判别式分类和重排序技术的藏文分词

基于判别式分类和重排序技术的藏文分词

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响.在构词粒度方面,分别考察了以基本字丁、基本字丁—音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构词粒度分词的F值最高,为91.21％;在分词结果重排序方面,提出一种基于词图的最短路径重排序策略,将判别式解码生成的切分结果压缩为加权有向图,图中节点表示音节间隔,而边所覆盖的音节作为候选切分并赋予不同权重,选择一条最短路径从而实现整句切分,最终分词结果的F值达到96.25％.

著录项

来源
《中文信息学报》|2014年第2期|61-65,90|共6页
作者
孙萌; 华却才让; 才智杰; 姜文斌; 吕雅娟; 刘群;
展开▼
作者单位

中国科学院计算技术研究所;

中国科学院智能信息处理重点实验室,北京100190;

中国科学院大学,北京,100049;

青海师范大学藏文信息研究中心,青海西宁810008;

青海师范大学藏文信息研究中心,青海西宁810008;

中国科学院计算技术研究所;

中国科学院智能信息处理重点实验室,北京100190;

中国科学院计算技术研究所;

中国科学院智能信息处理重点实验室,北京100190;

中国科学院计算技术研究所;

中国科学院智能信息处理重点实验室,北京100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
判别式; 藏文分词; 构词粒度; 重排序;
入库时间 2022-09-01 14:35:58

相似文献

中文文献
外文文献
专利

1. 一种基于判别式重排序的拼写校正方法 [J] . 张扬 ,何丕廉 ,向伟 . 软件学报 . 2008,第003期
2. 基于小字符集的藏文自动分词技术研究 [J] . 才华 . 西藏大学学报（自然科学版） . 2013,第002期
3. 基于词性约束的藏文分词策略与算法 [J] . 才让卓玛 ,才智杰 . 中文信息学报 . 2020,第002期
4. 基于BiLSTM_CRF模型的藏文分词方法 [J] . 王莉莉 ,王宏渊 ,白玛曲珍 . 重庆邮电大学学报（自然科学版） . 2020,第004期
5. 基于深度学习的藏文分词方法 [J] . 李博涵 ,刘汇丹 ,龙从军 . 计算机工程与设计 . 2018,第001期
6. 基于知识融合的CRFs藏文分词系统 [C] . Luobsang Karten ,洛桑嘎登 ,Yang Yuanyuan . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 基于判别式学习和组合分类器的Web文本分类技术 [A] . 张颜锋 . 2007

基于判别式分类和重排序技术的藏文分词

摘要

著录项

相似文献

相关主题

期刊订阅