【24h】

Neural Word Segmentation Learning for Chinese

机译:汉语神经分词学习

获取原文

摘要

Most previous approaches to Chinese word segmentation formalize this problem as a character-based sequence labeling task so that only contextual information within fixed sized local windows and simple interactions between adjacent tags can be captured. In this paper, we propose a novel neural framework which thoroughly eliminates context windows and can utilize complete segmentation history. Our model employs a gated combination neural network over characters to produce distributed representations of word candidates, which are then given to a long short-term memory (LSTM) language scoring model. Experiments on the benchmark datasets show that without the help of feature engineering as most existing approaches, our models achieve competitive or better performances with previous state-of-the-art methods.
机译:以前的大多数中文分词方法将这个问题形式化为基于字符的序列标记任务,因此只能捕获固定大小的本地窗口内的上下文信息以及相邻标签之间的简单交互。在本文中,我们提出了一种新颖的神经框架,该框架可以彻底消除上下文窗口并可以利用完整的细分历史记录。我们的模型在字符上使用门控组合神经网络来生成候选单词的分布式表示形式,然后将其提供给长短期记忆(LSTM)语言评分模型。在基准数据集上进行的实验表明,在没有像大多数现有方法那样借助特征工程的情况下,我们的模型可以使用以前的最新方法获得具有竞争力或更好的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号