首页> 外国专利> AUTOMATICALLY LABELING DATA USING CONCEPTUAL DESCRIPTIONS

AUTOMATICALLY LABELING DATA USING CONCEPTUAL DESCRIPTIONS

机译:使用概念描述自动标记数据

摘要

A system for automatically labeling data using conceptual descriptions. In one example, the system includes an electronic processor configured to generate unlabeled training data examples from one or more natural language documents and, for each of a plurality of categories, determine one or more concepts associated with a conceptual description of the category and generate a weak annotator for each of the one or more concepts. The electronic processor is also configured to apply each weak annotator to each training data example and, when a training data example satisfies a weak annotator, output a category associated with the weak annotator. For each training data example, the electronic processor determines a probabilistic distribution of the plurality of categories. For each training data example, the electronic processor labels the training data example with a category having the highest value in the probabilistic distribution determined for the training data example.
机译:使用概念描述自动标记数据的系统。 在一个示例中,该系统包括电子处理器,其被配置为从一个或多个自然语言文档生成未标记的训练数据示例,并且对于多个类别中的每一个,确定与类别的概念描述相关联的一个或多个概念并生成一个 一个或多个概念中的每一个的弱注释器。 电子处理器还被配置为将每个弱注释器应用于每个训练数据示例,并且当训练数据示例满足弱的注释器时,输出与弱注释器相关联的类别。 对于每个训练数据示例,电子处理器确定多个类别的概率分布。 对于每个训练数据示例,电子处理器将训练数据示例标记具有在为训练数据示例确定的概率分布中具有最高值的类别的类别。

著录项

  • 公开/公告号US2021334596A1

    专利类型

  • 公开/公告日2021-10-28

    原文格式PDF

  • 申请/专利权人 ROBERT BOSCH GMBH;

    申请/专利号US202016859695

  • 发明设计人 HAIBO DING;ZHE FENG;

    申请日2020-04-27

  • 分类号G06K9/62;G06N20;G06F40/169;G06F40/211;G06F40/284;

  • 国家 US

  • 入库时间 2022-08-24 21:57:20

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号