首页> 外文OA文献 >Automatic extraction of Arabic multiword expressions
【2h】

Automatic extraction of Arabic multiword expressions

机译:自动提取阿拉伯语多字表达式

摘要

In this paper we investigate the automatic acquisition of Arabic Multiword Expressions (MWE). We propose three complementary approaches to extract MWEs from available data resources. The first approach relies on the correspondence asymmetries between Arabic Wikipedia titles and titles in 21 different languages. The second approach collects English MWEs from Princeton WordNet 3.0, translates the collection into Arabic using Google Translate, and utilizes different search engines to validate the output. The third uses lexical association measures to extract MWEs from a large unannotated corpus. We experimentally explore the feasibility of each approach and measure the quality and coverage of the output against gold standards.
机译:在本文中,我们研究了阿拉伯多词表达(MWE)的自动获取。我们提出了三种补充方法来从可用数据资源中提取MWE。第一种方法依靠阿拉伯维基百科标题与21种不同语言的标题之间的对应不对称性。第二种方法从普林斯顿WordNet 3.0收集英语MWE,使用Google Translate将收集的内容翻译成阿拉伯语,并利用不同的搜索引擎来验证输出。第三种使用词汇关联度量从大型无注释语料库中提取MWE。我们通过实验探索每种方法的可行性,并根据黄金标准衡量产出的质量和覆盖率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号