首页> 外文会议>Association for Computational Linguistics Annual Meeting >Corpus representativeness for syntactic information acquisition
【24h】

Corpus representativeness for syntactic information acquisition

机译:句法信息收购的语料库代表性

获取原文

摘要

This paper refers to part of our research in the area of automatic acquisition of computational lexicon information from corpus. The present paper reports the ongoing research on corpus representativeness. For the task of inducing information out of text, we wanted to fix a certain degree of confidence on the size and composition of the collection of documents to be observed. The results show that it is possible to work with a relatively small corpus of texts if it is tuned to a particular domain. Even more, it seems that a small tuned corpus will be more informative for real parsing than a general corpus.
机译:本文是指我们在来自语料库的自动获取计算词典信息领域的一部分研究。 本文报告了持续研究语料库代表性。 对于诱导文本中信息的任务,我们希望为要观察到的文件集合的大小和组成来解决一定程度的信心。 结果表明,如果将其调谐到特定域,则可以使用相对小的文本语料库。 甚至更多,似乎一个小型调整的语料库将比一般的语料库更具信息丰富。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号