Mention Detection for Coreference Resolution in Polish. Development of the Formal GrammarThis paper presents the results of an improvement and extension of the Shallow Grammar of Polish, designed for the needs of the Computer-based Methods for Coreference Resolution in Polish Texts (CORE) project. The role of the Grammar was to detect nominal groups (i.e. multi-level nested phrases) that could be considered as mentions in coreference resolution tasks. In this article, the reorganization and changes to the Grammar are described, as well as the results of an evaluation of the Polish Coreference Corpus with manual annotations of mentions and coreferential expressions. A comparison of the second version of the Grammar with an evaluation of the first version reveals an improvement to the recall and F1 measures. Parsing płytki relacji koreferencji w języku polskim. Rozwój gramatyki formalnejCelem artykułu jest przedstawienie rezultatów prac zmierzających do rozszerzenia gramatyki powierzchniowej języka polskiego, stworzonej na potrzeby projektu "Komputerowe metody identyfikacji nawiązań w tekstach polskich" (grant NCN nr 6505/B/T02/2011/40), oraz poprawy wyników jej działania. Rolą gramatyki powierzchniowej jest wykrywanie grup nominalnych, które mogą wchodzić w relację koreferencji z innymi wyrażeniami w tekście. Nowa gramatyka została przetestowana z użyciem Polskiego Korpusu Koreferencyjnego, w którym grupy nominalne oraz relacje koreferencji między nimi zostały oznaczone ręcznie. Porównanie nowej wersji gramatyki z wersją poprzednią wykazało poprawę zarówno skuteczności wykrywania odpowiednich grup, jak i wzrost miary F1.
展开▼
机译:在波兰语中提及练习分辨率的检测。正式的语法本文的开发介绍了浅色语法的改善和延伸的结果,专为波兰语文本(核心)项目中的基于计算机的Coreference分辨率的需求而设计。语法的作用是检测标称组(即多级嵌套短语),可以被视为在Coreference解决任务中的提到。在本文中,描述了语法的重组和变化,以及具有手工和经验表达的手动注释的波兰芯参考语料库的评估结果。与第一个版本评估的语法的第二版本的比较显示了对召回和F1措施的改进。 ParsingpłytkiRelacji Koreferencji WJęZykuPolskim。 Rozwójgramatyki formalnejCelemartykułu开玩笑przedstawienierezultatówPRACzmierzających做rozszerzenia gramatyki powierzchniowejjęzykapolskiego,stworzonej NA potrzeby projektu “Komputerowe metody identyfikacjinawiązań瓦特tekstach polskich”(授予NCN NR 6505 / B / T02 / 2011/40),oraz poprawywynikówJEJdziałania。 rolīgramatyki powierzchniowej jest wykrywanie grup nominalnych,któremogąwchodzićwrelacjękoreferencjizinnymiwyraženiamiwtekście。 Nowa GramatykaZostałaPrzetestowanaZUīyciemPolskiegoKorpusu Koreferencyjnego,WKtórymGrupyNominalne Oraz Relacje KoreferencjiMiędzy尼米Zostałyoznaczoneręcznie。 porównanienumej wersji gramatyki zversjąpoprzedniąwykazałopoprawęzarównoskutecznościwykrywania odpowiednich grup,jak i wzrost arial f1。
展开▼