Reading Comprehension in Czech via Machine Translation and Cross-Lingual Transfer

机译：机器翻译和跨语言翻译在捷克语中的阅读理解能力

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Reading comprehension is a well studied task, with huge training datasets in English. This work focuses on building reading comprehension systems for Czech, without requiring any manually annotated Czech training data. We then trained and evaluated several BERT and XLM-RoBERTa baseline models. However, our main focus lies in cross-lingual transfer models. We report that a XLM-RoBERTa model trained on English data and evaluated on Czech achieves very competitive performance, only approximately 2% points worse than a model trained on the translated Czech data. This result is extremely good, considering the fact that the model has not seen any Czech data during training. The cross-lingual transfer approach is very flexible and provides a reading comprehension in any language, for which we have enough monolingual raw texts.

机译：阅读理解是一项经过充分研究的任务，拥有大量的英语培训数据集。这项工作着重于为捷克语构建阅读理解系统，而不需要任何人工注释的捷克语培训数据。然后，我们训练并评估了一些BERT和XLM-RoBERTa基线模型。但是，我们的主要重点在于跨语言迁移模型。我们报告说，在英语数据上训练并在捷克语上进行评估的XLM-RoBERTa模型取得了非常好的竞争性能，仅比在翻译后的捷克数据上训练的模型差了约2％。考虑到该模型在训练过程中没有看到任何捷克数据，因此这个结果非常好。跨语言迁移方法非常灵活，可以提供任何语言的阅读理解，为此我们有足够的单语原始文本。

著录项

来源
《International conference on text, speech, and dialogue》|2020年|171-179|共9页
会议地点
作者
Katerina Mackova; Milan Straka;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Reading comprehension; Czech; SQuAD; BERT; Cross-lingual transfer;

机译：阅读理解;捷克文队; BERT;跨语言迁移;
入库时间 2022-08-26 13:55:03

相似文献

外文文献
中文文献
专利

1. Machine versus human translation outputs: Which one results in better reading comprehension among EFL learners? [J] . Mojtaba Maghsoudi, Vahid Mirzaeian The JALT CALL Journal . 2020,第2期

机译：机器与人类翻译输出：哪一个导致EFL学习者中更好地阅读理解？
2. Multi-task transfer learning for biomedical machine reading comprehension [J] . International journal of data mining and bioinformatics . 2020,第3期

机译：生物医学机器阅读理解的多任务转移学习
3. NewsReader: Using knowledge resources in a cross-lingual reading machine to generate more knowledge from massive streams of news [J] . Vossen Piek, Agerri Rodrigo, Aldabe Itziar, Knowledge-Based Systems . 2016,第octa15期

机译：NewsReader：在跨语言阅读机中使用知识资源从大量新闻流中产生更多知识
4. Zero-shot Reading Comprehension by Cross-lingual Transfer Learning with Multi-lingual Language Representation Model [C] . Tsung-Yuan Hsu, Chi-liang Liu, Hung-yi Lee International joint conference on natural language processing;Conference on empirical methods in natural language processing . 2019

机译：跨语言迁移学习与多语言表示模型的零散阅读理解
5. A COMPARISON OF READING VOCABULARY AND READING COMPREHENSION SKILLS BETWEEN BILINGUAL AND MONOLINGUAL CZECH-AMERICAN STUDENTS. [D] . HOLICK, ROBERT JOSEPH. 1975

机译：双语和单语捷克裔学生的阅读词汇和阅读理解技能的比较。
6. Integrate Candidate Answer Extraction with Re-Ranking for Chinese Machine Reading Comprehension [O] . Junjie Zeng, Xiaoya Sun, Qi Zhang, 2021

机译：将候选答案提取与中国机器阅读理解重新排名
7. Reading Comprehension in Czech via Machine Translation and Cross-Lingual Transfer [O] . Kateřina Macková, Milan Straka 2020

机译：通过机器翻译和交叉转移在捷克语中阅读理解

Reading Comprehension in Czech via Machine Translation and Cross-Lingual Transfer

摘要

著录项

相似文献

相关主题

期刊订阅