首页> 外文会议>Document recognition and retrieval XIX >Combining SVM Classifiers to Identify Investigator Name Zones in Biomedical Articles
【24h】

Combining SVM Classifiers to Identify Investigator Name Zones in Biomedical Articles

机译:结合SVM分类器以识别生物医学文章中的研究者姓名区域

获取原文
获取原文并翻译 | 示例

摘要

This paper describes an automated system to label zones containing Investigator Names (IN) in biomedical articles, a key item in a MEDLINE® citation. The correct identification of these zones is necessary for the subsequent extraction of IN from these zones. A hierarchical classification model is proposed using two Support Vector Machine (SVM) classifiers. The first classifier is used to identify an IN zone with highest confidence, and the other classifier identifies the remaining IN zones. Eight sets of word lists are collected to train and test the classifiers, each set containing collections of words ranging from 100 to 1,200. Experiments based on a test set of 105 journal articles show a Precision of 0.88, 0.97 Recall, 0.92 F-Measure, and 0.99 Accuracy.
机译:本文介绍了一种自动系统,用于在生物医学文章中标记包含研究者姓名(IN)的区域,这是MEDLINE®引文中的关键项。这些区域的正确识别对于随后从这些区域中提取IN是必要的。提出了使用两个支持向量机(SVM)分类器的分层分类模型。第一个分类器用于标识置信度最高的IN区域,另一个分类器标识其余的IN区域。收集八组单词列表以训练和测试分类器,每组包含从100到1200范围内的单词集合。基于105个期刊文章的测试集进行的实验显示,精度为0.88、0.97查全率,0.92 F量度和0.99精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号