Automatic Diacritization as Prerequisite Towards the Automatic Generation of Arabic Lexical Recognition Tests

机译：自动Diacritization是自动生成阿拉伯语词汇识别测试的前提

获取原文

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

The automatic generation of Arabic lexical recognition tests entails several NLP challenges, including corpus linguistics, automatic diacritization, lemmatization and language modeling. Here, we only address the problem of automatic diacritization, a step that paves the road for the automatic generation of Arabic LRTs. We conduct a comparative study between the available tools for diacritization (Farasa and Madamira) and a strong baseline. We evaluate the error rates for these systems using a set of publicly available (almost) fully diacritized corpora, but in a relaxed evaluation mode to ensure fair comparison. Farasa outperforms Madamira and the baseline under all conditions.

机译：自动生成阿拉伯语词汇识别测试会带来一些NLP挑战，包括语料库语言学，自动双歧化，词形化和语言建模。在这里，我们仅解决自动数字化的问题，这一步骤为自动生成阿拉伯语LRT铺平了道路。我们进行了比较分析，比较了可用的双眼畸形工具（Farasa和Madamira）和强基准。我们使用一组公开可用的（几乎）全双全语料库评估这些系统的错误率，但以宽松的评估模式来确保公平比较。在所有条件下，Farasa的表现均优于Madamira和基线。

著录项

来源
《International conference on natural language and speech processing》|2019年|100-106|共7页
会议地点 Trento(IT)
作者
Osama Hamed; Torsten Zesch;
展开▼
作者单位

Language Technology Lab University of Duisburg-Essen;

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Effective Deep Learning Models for Automatic Diacritization of Arabic Text [J] . Mokthar Ali Hasan Madhfar, Ali Mustafa Qamar Quality Control, Transactions . 2021,第1期

机译：用于阿拉伯文自动禁证的有效深度学习模型
2. Automatic minimal diacritization of Arabic texts [J] . Rehab Alnefaie, Aqil M. Azmi Procedia Computer Science . 2017,第1期

机译：自动最小化阿拉伯文本
3. Deep Learning Framework with Confused Sub-Set Resolution Architecture for Automatic Arabic Diacritization [J] . Rashwan Mohsen /A/. /A/., Al Sallab Ahmad /A/., Raafat Hazem M., Audio, Speech, and Language Processing, IEEE/ACM Transactions on . 2015,第3期

机译：带有混淆子集解析架构的深度学习框架，用于自动阿拉伯文数字化
4. Automatic Diacritization as Prerequisite Towards the Automatic Generation of Arabic Lexical Recognition Tests [C] . Osama Hamed, Torsten Zesch International conference on natural language and speech processing . 2019

机译：自动变动作为自动生成阿拉伯词汇识别试验的先决条件
5. Machine Learning Methods for Building Educational Applications: Concept Prerequisite Learning and Automatic Distractor Generation [D] . Liang, Chen 2018

机译：用于教学应用的机器学习方法：概念先决条件学习和自动干扰生成
6. Formant analysis in dysphonic patients and automatic Arabic digit speech recognition [O] . Ghulam Muhammad, Tamer A Mesallam, Khalid H Malki, 2011

机译：语音障碍患者的共振峰分析和阿拉伯数字自动语音识别
7. Automatic Diacritization of Arabic for Acoustic Modeling in Speech Recognition [O] . Dimitra Vergyri, Katrin Kirchhoff 2004

机译：语音识别中声学建模的阿拉伯语自动语音化
8. Automatic Diacritization of Arabic for Acoustic Modeling in Speech Recognition [R] . Vergyri, D. , Kirchhoff, K. 2004

机译：语音识别中声学建模的阿拉伯语自动语音化

Automatic Diacritization as Prerequisite Towards the Automatic Generation of Arabic Lexical Recognition Tests

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅