Learning from Measurements in Crowdsourcing Models: Inferring Ground Truth from Diverse Annotation Types

机译：从众包模型中的测量学习：从不同的注释类型推断出原始事实

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Annotated corpora enable supervised machine learning and data analysis. To reduce the cost of manual annotation, tasks are often assigned to internet workers whose judgments are reconciled by crowdsourcing models. We approach the problem of crowdsourcing using a framework for learning from rich prior knowledge, and we identify a family of crowdsourcing models with the novel ability to combine annotations with differing structures: e.g.. document labels and word labels. Annotator judgments are given in the form of the predicted expected value of measurement functions computed over annotations and the data, unifying annotation models. Our model, a specific instance of this framework, compares favorably with previous work. Furthermore, it enables active sample selection, jointly selecting annotator, data item, and annotation structure to reduce annotation effort. Annotierte Korpora ermoeglichen ueberwachtes maschinelles Lernen und Datenanalyse. Um die Kosten fuer manuelle Annotationen zu vermeiden. werden Aufgaben haufig Intemetarbeitern zugewiesen, deren Urteile durch Crowdsourcing-Modelle abgeglichen werden. Wir nahern uns dem Problem des Crowdsourcings, indem wir einen Rahmen fur das Lernen aus reichem Vor-wissen vorschlagen, und wir bestimmen eine Familie von Crowdsourcing-Modellen mit der Fahigkeit, Annotationen mit unterschiedlichen Strukturen zu kombinieren: z.B., Dokument-bezeichnungen und Wortbezeichnungen. Bewertungen werden in Form des vorhergesagten erwarteten Werts von Messfunktionen (measurement functions) gegeben, die iiber Annotationen und die Daten berechnet werden. Darin werden die vorherige Annotationsmodelle verein-heitlicht. Unser Modell, eine spezifische Instanz dieses Rahmens, schneidet im Vergleich zu fruheren Arbeiten positiv ab. Dariiber hinaus ermoglicht es die aktive Stichprobenauswahl, indem Kommentator, Datenelement, und Annotationsstruktur gemeinsam ausgewahlt werden, um den Annotationskosten zu reduzieren.

机译：注释的Corpora启用监督机器学习和数据分析。为了降低手动注释的成本，任务通常被分配到互联网工作人员，其判决通过众包和解模型和解。我们利用富有的先验知识学习框架方法涉及众所周心的问题，我们识别一个众包模型，具有与不同结构的注释组合的新功能：例如，文档标签和单词标签。注释器判断以预测的函数的预测预期值的形式给出，以通过注释和数据计算，统一注释模型。我们的模型是本框架的特定实例，对以前的工作有利地比较。此外，它能够激活采样选择，共同选择注释器，数据项和注释结构，以减少注释工作。 Annotierte Korpora Ermoeglichen Ueberwachtes Maschinelles Lernen und Datenanalyse。 UM Die Kosten Fuer Manuelle Annotationen Zu Vermeiden。 Werden Aufgaben Haufig Intemetarbeitern Zugewiesen，Deren Urteile Durch Crowdsourcing-Models Abgeglichen Werden。世界投资报告nahern UNS DEM问题DES Crowdsourcings，indem世界投资报告einen拉赫曼毛皮DAS Lernen AUS reichem涡WISSEN vorschlagen，UND世界投资报告bestimmen EINE FAMILIE冯众包，Modellen麻省理工学院DER Fahigkeit，Annotationen MIT unterschiedlichen Strukturen祖kombinieren：z.B.，库门，bezeichnungen UND Wortbezeichnungen。 Bewertungen Werden in Des Vorergesagten erwarteten Werts von Messfunktionen（测量功能）Gegeben，Die Iber Annotationen und Die Daten Berechnet Werden。 Darin Werden Die Vorherize AnnotationsModelle Verein-Heitlicht。不当Modell，Eine Spezifische Instanz Dieses Rahmens，Schneidet Im Vergleich Zu Fruheren Arbeiten Positiv AB。 Dariiber Hinaus ermoglicht es die aktive stichprobenauswahl，Indem Kommentator，DateneLement，undennationsstruktur Gemeinsam Ausgewahlt Werden，Um Den Annotationskosten Zu Reduzieren。

著录项

来源
《International conference on computational linguistics》|2018年|lxxi p. 1304-1962|共11页
会议地点
作者
Paul Felt; Eric K. Ringger; Jordan Boyd-Graber; Kevin Seppi;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类程序设计、软件工程;
关键词

相似文献

外文文献
中文文献
专利

1. A Novel Label Aggregation with Attenuated Scores for Ground-Truth Identification of Dataset Annotation with Crowdsourcing [J] . Ratchainant THAMMASUDJARIT, Anon PLANGPRASOPCHOK, Charnyote PLUEMPITIWIRIYAWEJ IEICE transactions on information and systems . 2017,第4期

机译：一种具有减分的新颖标签聚合，用于众包数据集注释的地面-事实识别
2. Effect of sediment type on microphytobenthos vertical distribution: Modelling the productive biomass and improving ground truth measurements [J] . B. Jesus, C.R. Mendes, V. Brotas, Journal of Experimental Marine Biology and Ecology . 2006,第1期

机译：沉积物类型对微小底栖动物垂直分布的影响：模拟生产性生物量并改善地面实况测量
3. Crowdsourcing image analysis for plant phenomics to generate ground truth data for machine learning [J] . Naihui Zhou, Zachary D. Siegel, Scott Zarecor, PLoS Computational Biology . 2018,第7期

机译：对植物表象学进行众包图像分析以生成用于机器学习的地面真相数据
4. Learning from Measurements in Crowdsourcing Models: Inferring Ground Truth from Diverse Annotation Types [C] . Paul Felt, Eric K. Ringger, Jordan Boyd-Graber, International conference on computational linguistics . 2018

机译：从众包模型中的度量中学习：从各种注释类型中推断出地面真理
5. Crowdsourcing annotation for machine learning in natural language processing tasks. [D] . Zaidan, Omar F. 2012

机译：用于自然语言处理任务中机器学习的众包注释。
6. Crowdsourcing image analysis for plant phenomics to generate ground truth data for machine learning [O] . Naihui Zhou, Zachary D. Siegel, Scott Zarecor, 2018

机译：对植物表象学进行众包图像分析以生成用于机器学习的地面真相数据
7. Crowdsourcing Image Analysis for Plant Phenomics to Generate Ground Truth Data for Machine Learning [O] . Naihui Zhou, Zachary D Siegel, Scott Zarecor, 2018

机译：植物能力众包图像分析，为机器学习产生地面真理数据

Learning from Measurements in Crowdsourcing Models: Inferring Ground Truth from Diverse Annotation Types

摘要

著录项

相似文献

相关主题

期刊订阅