首页> 外文OA文献 >Words without Boundaries : computational Approaches to Chinese Word Segmentation
【2h】

Words without Boundaries : computational Approaches to Chinese Word Segmentation

机译:无边界单词:中文分词的计算方法

摘要

The fact that words are not conventionally demarcated in Chinese orthography makes the process of word segmentation non-trivial. Chinese word segmentation remains a challenging topic in Chinese computational linguistics. We survey previous approaches to Chinese word segmentation, including dictionary look-up, strength of internal binding, as well as character tagging and machine learning. The Word Boundary Decision (WBD) approach which requires no prior lexical knowledge is proposed. It is shown that the WBD model greatly reduces the complexity of Chinese word segmentation and may provide a promising approach to address domain adaption and robustness issues.
机译:在中国拼字法中,通常不会对单词进行划分,这一事实使切词过程变得不那么重要。中文分词仍然是中国计算语言学中一个具有挑战性的话题。我们调查了以前的中文分词方法,包括字典查找,内部绑定强度以及字符标记和机器学习。提出了不需要任何词汇知识的词边界决策(WBD)方法。结果表明,WBD模型极大地降低了中文分词的复杂度,可以为解决领域自适应和鲁棒性问题提供一种有希望的方法。

著录项

  • 作者

    Huang CR;

  • 作者单位
  • 年度 2012
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号