首页> 中文期刊>中文信息学报 >基于层叠条件随机场的高棉语分词及词性标注方法

基于层叠条件随机场的高棉语分词及词性标注方法

     

摘要

针对高棉语分词及词性标注问题,提出一种基于层叠条件随机场模型的自动分词及词性标注方法.该方法由三层条件随机场模型构成:第一层是分词模型,该模型以字符簇为粒度,结合上下文信息与高棉语的构词特点构建特征模板,实现对高棉语句子的自动分词;第二层是分词结果修正模型,该模型以词语为粒度,结合上下文信息与高棉语中命名实体的构成特点构建特征模板,实现对第一层分词结果的修正;第三层是词性标注模型,该模型以词语为粒度,结合上下文信息与高棉语丰富的词缀信息构建特征模板,实现对高棉语句子中的词语进行自动标注词性.基于该模型进行开放测试实验,最终准确率为95.44%,结果表明该方法能有效解决高棉语的分词和词性标注问题.

著录项

  • 来源
    《中文信息学报》|2016年第4期|110-116|共7页
  • 作者单位

    昆明理工大学信息工程与自动化学院和云南省计算机技术应用重点实验室,云南昆明650500;

    昆明理工大学信息工程与自动化学院和云南省计算机技术应用重点实验室,云南昆明650500;

    昆明理工大学信息工程与自动化学院和云南省计算机技术应用重点实验室,云南昆明650500;

    昆明理工大学信息工程与自动化学院和云南省计算机技术应用重点实验室,云南昆明650500;

    昆明理工大学信息工程与自动化学院和云南省计算机技术应用重点实验室,云南昆明650500;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    高棉语; 层叠条件随机场; 分词; 词性标注;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号