首页> 外文会议>International Workshop on Computational Terminology >TermEval 2020: TALN-LS2N System for Automatic Term Extraction
【24h】

TermEval 2020: TALN-LS2N System for Automatic Term Extraction

机译:TermEval 2020:用于自动术语提取的TALN-LS2N系统

获取原文

摘要

Automatic terminology extraction is a notoriously difficult task aiming to ease effort demanded to manually identify terms in domain-specific corpora by automatically providing a ranked list of candidate terms. The main ways that addressed this task can be ranged in four main categories: (ⅰ) rule-based approaches, (ⅱ) feature-based approaches, (ⅲ) context-based approaches, and (ⅳ) hybrid approaches. For this first TermEval shared task, we explore a feature-based approach, and a deep neural network multitask approach -BERT- that we fine-tune for term extraction. We show that BERT models (RoBERTa for English and CamemBERT for French) outperform other systems for French and English languages.
机译:自动术语提取是一项众所周知的困难任务,旨在通过自动提供候选术语的排序列表来减轻手动识别特定领域语料库中的术语所需的工作。解决此任务的主要方式可以分为四个主要类别:(ⅰ)基于规则的方法,(ⅱ)基于特征的方法,(ⅲ)基于上下文的方法和(ⅳ)混合方法。对于第一个TermEval共享任务,我们探索了一种基于特征的方法,以及一种我们针对词条提取进行了微调的深度神经网络多任务方法-BERT。我们证明了BERT模型(英语为RoBERTa,法语为CamemBERT)优于其他系统的法语和英语。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号