【24h】

Multichannel LSTM-CRF for Named Entity Recognition in Chinese Social Media

机译:用于中文社交媒体中的命名实体识别的多通道LSTM-CRF

获取原文

摘要

Named Entity Recognition (NER) is a tough task in Chinese social media due to a large portion of informal writings. Existing research uses only limited in-domain annotated data and achieves low performance. In this paper, we utilize both limited in-domain data and enough out-of-domain data using a domain adaptation method. We propose a multichannel LSTM-CRF model that employs different channels to capture general patterns, in-domain patterns and out-of-domain patterns in Chinese social media. The extensive experiments show that our model yields 9.8% improvement over previous state-of-the-art methods. We further find that a shared embedding layer is important and randomly initialized embeddings are better than the pretrained ones.
机译:由于大量非正式文章,在中国社交媒体中,命名实体识别(NER)是一项艰巨的任务。现有研究仅使用有限的域内批注数据,并且性能低下。在本文中,我们使用域自适应方法来利用有限的域内数据和足够的域外数据。我们提出了一种多渠道的LSTM-CRF模型,该模型采用不同的渠道来捕获中国社交媒体中的一般模式,域内模式和域外模式。广泛的实验表明,与以前的最新方法相比,我们的模型可提高9.8%。我们进一步发现,共享的嵌入层很重要,并且随机初始化的嵌入比预训练的嵌入要好。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号