首页> 外文期刊>Procedia Computer Science >Feature-Rich Classifiers for Recognizing Textual Entailment in Indonesian
【24h】

Feature-Rich Classifiers for Recognizing Textual Entailment in Indonesian

机译:功能丰富的分类器,用于识别印度尼西亚语的文本意外

获取原文
           

摘要

Recognizing Textual Entailment (RTE) is a Natural Language Processing task to determine whether a sentence (text) semantically entails another sentence (hypothesis). In this paper, we extracted and learned 35 features from a pair of text and hypothesis in Indonesian. The ablation study was conducted to analyze features contribution to RTE model. The experiments shown that, using Support Vector Machine (SVM) and Logistic Regression, the token-based features contribute positively to improve the model performance. The best model in our experiment is SVM that scored F1-Score of 79.65%. Despite sacrificing 5-points accuracy to the state-of-the-art BERT model, SVM classifier is 31 hours more efficient in terms of training time.
机译:识别文本素食(RTE)是一种自然语言处理任务,以确定句子(文本)语义是否需要另一个句子(假设)。 在本文中,我们在印度尼西亚的一对文本和假设中提取和学习了35个功能。 进行了消融研究以分析对RTE模型的贡献。 实验表明,使用支持向量机(SVM)和Logistic回归,基于令牌的特征贡献积极贡献以提高模型性能。 我们实验中的最佳模型是SVM,得分为79.65%。 尽管对最先进的BERT型号牺牲了5分精度,但SVM分类器在训练时间方面的31小时是31小时。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号