首页> 外文会议>41st annual meeting of the Association for Computational Linguistics : Proceedings of the conference >Integrating Ngram Model and Case-based LearningFor Chinese Word Segmentation
【24h】

Integrating Ngram Model and Case-based LearningFor Chinese Word Segmentation

机译:Ngram模型与案例学习相结合的中文分词

获取原文
获取外文期刊封面目录资料

摘要

This paper presents our recent workfor participation in the First InternationalChinese Word Segmentation Bakeoff(ICWSB-1). It is based on a generalpurposengram model for word segmentationand a case-based learning approachto disambiguation. This system excelsin identifying in-vocabulary (IV) words,achieving a recall of around 96-98%.Here we present our strategies for languagemodel training and disambiguationrule learning, analyze the system's performance,and discuss areas for further improvement,e.g., out-of-vocabulary (OOV)word discovery.
机译:本文介绍了我们最近的工作 参加第一国际 中文分词烘烤 (ICWSB-1)。它基于通用 用于词分割的ngram模型 和基于案例的学习方法 消除歧义。这个系统擅长 在识别词汇中的(IV)单词时, 召回率约为96-98%。 在这里,我们介绍我们的语言策略 模型训练和消歧 进行规则学习,分析系统性能, 并讨论需要进一步改进的领域, 例如,语音提示(OOV) 单词发现。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号