首页> 外文会议>International conference on computational linguistics;COLING 2010 >Automatic Extraction of Arabic Multiword Expressions
【24h】

Automatic Extraction of Arabic Multiword Expressions

机译:自动提取阿拉伯多词表达

获取原文

摘要

In this paper we investigate the automatic acquisition of Arabic Multiword Expressions (MWE). We propose three complementary approaches to extract MWEs from available data resources. The onrst approach relies on the correspondence asymmetries between Arabic Wikipedia titles and titles in 21 different languages. The second approach collects English MWEs from Princeton WordNet 3.0, translates the collection into Arabic using Google Translate, and utilizes different search engines to validate the output. The third uses lexical association measures to extract MWEs from a large unannotated corpus. We experimentally explore the feasibility of each approach and measure the quality and coverage of the output against gold standards.
机译:在本文中,我们研究了阿拉伯多词表达(MWE)的自动获取。我们提出了三种补充方法来从可用数据资源中提取MWE。第一种方法依靠阿拉伯维基百科标题与21种不同语言的标题之间的对应不对称性。第二种方法是从Princeton WordNet 3.0收集英语MWE,然后使用Google Translate将收集的内容翻译成阿拉伯语,然后利用不同的搜索引擎来验证输出。第三种使用词法关联度量从大型无注释语料库中提取MWE。我们通过实验探索每种方法的可行性,并根据黄金标准衡量产出的质量和覆盖率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号