首页> 外文OA文献 >Multi-label classification of Croatian legal documents using EuroVoc thesaurus
【2h】

Multi-label classification of Croatian legal documents using EuroVoc thesaurus

机译:使用EuroVoc词库对克罗地亚法律文件进行多标签分类

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The automatic indexing of legal documents can improve access to legislation. In this paper we describe the work on EuroVoc indexing of Croatian legislative documents. We focus on the machine learning aspect of the problem. First, we describe the manually indexed Croatian legislative documents collection, which we make freely available. Secondly, we describe the multi-label classification experiments on this collection. A challenge of EuroVoc indexing is class sparsity, and we discuss some strategies to address it. Our best model achieves 79.6% precision, 60.2% recall, and 68.6% F1-score.
机译:法律文件的自动索引可以改善对立法的访问。在本文中,我们描述了克罗地亚立法文件对EuroVoc索引的工作。我们专注于问题的机器学习方面。首先,我们描述了手动索引的克罗地亚立法文件集,我们免费提供它们。其次,我们描述了该集合的多标签分类实验。 EuroVoc索引编制面临的挑战是类稀疏性,我们将讨论一些解决方案。我们最好的模型可实现79.6%的精度,60.2%的召回率和68.6%的F1得分。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号