Improving Arabic Diacritization with Regularized Decoding and Adversarial Training

机译：用规则化解码和对抗训练改善阿拉伯语杂记化

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Arabic diacritization is a fundamental task for Arabic language processing. Previous studies have demonstrated that automatically generated knowledge can be helpful to this task. However, these studies regard the auto-generated knowledge instances as gold references, which limits their effectiveness since such knowledge is not always accurate and inferior instances can lead to incorrect predictions. In this paper, we propose to use regularized decoding and adversarial training to appropriately learn from such noisy knowledge for diacritization. Experimental results on two benchmark datasets show that, even with quite flawed auto-generated knowledge, our model can still learn adequate diacritics and outperform all previous studies, on both datasets.

机译：阿拉伯语变速制是阿拉伯语处理的基本任务。以前的研究表明，自动生成的知识可能对此任务有所帮助。然而，这些研究将自动产生的知识实例视为金参考，这限制了它们的有效性，因为这些知识并不总是准确，并且劣质的实例可能导致错误的预测。在本文中，我们建议使用正规化的解码和对抗性培训，从而适当地从这种嘈杂的虚构知识中学习。在两个基准数据集上的实验结果表明，即使具有相当有缺陷的自动生成的知识，我们的模型仍然可以在两个数据集中学习适当的历史记录和优于以前的所有研究。

著录项

来源
《Annual Meeting of the Association for Computational Linguistics;International Joint Conference on natural Language Processing》|2021年|534-542|共9页
会议地点
作者
Han Qin; Guimin Chen; Yuanhe Tian; Yan Song;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
入库时间 2022-08-26 13:58:15

相似文献

外文文献
中文文献
专利

1. Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization [J] . Amine Chennoufi, Azzeddine Mazroui International journal of speech technology . 2016,第2期

机译：形态分析和大型训练语料库对阿拉伯语二尖瓣反演效果的影响
2. Graph Adversarial Training: Dynamically Regularizing Based on Graph Structure [J] . Feng Fuli, He Xiangnan, Tang Jie, IEEE Transactions on Knowledge and Data Engineering . 2021,第6期

机译：图对逆势训练：基于图形结构动态规范
3. Virtual Adversarial Training: A Regularization Method for Supervised and Semi-Supervised Learning [J] . Miyato Takeru, Maeda Shin-Ichi, Koyama Masanori, IEEE Transactions on Pattern Analysis and Machine Intelligence . 2019,第8期

机译：虚拟对抗训练：一种监督和半监督学习的正则化方法
4. Deep Diacritization: Efficient Hierarchical Recurrence for Improved Arabic Diacritization [C] . Badr AlKhamissi, Muhammad N.ElNokrashy, Mohamed Gabr Workshop on Arabic Natural Language Processing . 2020

机译：深度卷发：有效的等级复发，用于改进的阿拉伯语变量
5. Robust Vision and Language Inference via Semantics Transformed Adversarial Training [D] . Chaudhary, Abhishek. 2021

机译：通过语义转型对抗对抗培训强大的视觉和语言推断
6. Improving Image-Based Plant Disease Classification With Generative Adversarial Network Under Limited Training Set [O] . Luning Bi, Guiping Hu 2020

机译：在有限训练集下改善具有生成对抗性网络的基于图像的植物疾病分类
7. Improving Arabic Diacritization through Syntactic Analysis [O] . Anas Shahrour, Salam Khalifa, Nizar Habash 2015

机译：通过句法分析改善阿拉伯语杂记化

Improving Arabic Diacritization with Regularized Decoding and Adversarial Training

摘要

著录项

相似文献

相关主题

期刊订阅