首页> 外文期刊>International Journal of Computational Science and Engineering >Building a large-scale testing dataset for conceptual semantic annotation of text
【24h】

Building a large-scale testing dataset for conceptual semantic annotation of text

机译:构建一个大型测试数据集,用于文本的概念语义注释

获取原文
获取原文并翻译 | 示例
           

摘要

>One major obstacle facing the research on semantic annotation is lack of large-scale testing datasets. In this paper, we develop a systematic approach to constructing such datasets. This approach is based on guided ontology auto-construction and annotation methods which use little priori domain knowledge and little user knowledge in documents. We demonstrate the efficacy of the proposed approach by developing a large-scale testing dataset using information available from MeSH and PubMed. The developed testing dataset consists of a large-scale ontology, a large-scale set of annotated documents, and the baselines to evaluate the target algorithm, which can be employed to evaluate both the ontology construction algorithms and semantic annotation algorithms.
机译:>面临着对语义注释的研究的一个主要障碍是缺乏大规模的测试数据集。 在本文中,我们开发了构建此类数据集的系统方法。 这种方法是基于引导本体的自动构建和注释方法,它在文档中使用了很少的先验域知识和小用户知识。 我们通过使用网格和Pubmed的信息展示了所提出的方法来展示所提出的方法的功效。 开发的测试数据集包括大规模的本体论,一个大规模的注释文件,以及评估目标算法的基线,可以采用来评估本体建设算法和语义注释算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号