首页> 外文期刊>International journal of rough sets and data analysis >An Arabic Dialects Dictionary Using Word Embeddings
【24h】

An Arabic Dialects Dictionary Using Word Embeddings

机译:使用Word Embeddings的阿拉伯语方言字典

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

The dialectical Arabic and the Modern Standard Arabic lacks sufficient standardized language resources to enable the tasks of Arabic language processing, despite it being an active research area. This work addresses this issue by firstly highlighting the steps and the issues related to building a multi Arabic dialect corpus using web data from blogs and social media platforms (i.e. Facebook, Twitter, etc.). This is to create a vectorized dictionary for the crawled data using the word Embeddings. In other terms, the goal of this article is to build an updated multi-dialect data set, and then, to extract an annotated corpus from it.
机译:尽管它是活跃的研究区,但辩证阿拉伯语和现代标准阿拉伯语缺乏足够的标准化语言资源,以实现阿拉伯语处理的任务。这项工作首先突出了使用来自博客和社交媒体平台的Web数据(即Facebook,Twitter等)的Web数据,通过首先突出这些问题和与构建多阿拉伯语方言语料库相关的步骤和问题来解决这个问题。这是使用Word Embeddings创建用于爬网数据的矢量化词典。在其他术语中,本文的目标是构建更新的多语句数据集,然后,从中提取注释的语料库。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号