首页> 外文会议>Human language technology >Automatic Extraction of Grammars From Annotated Text
【24h】

Automatic Extraction of Grammars From Annotated Text

机译:从带注释的文本中自动提取语法

获取原文
获取原文并翻译 | 示例

摘要

The primary objective of this project is to develop a robust, high-performance parser for English by automatically extracting a grammar from an annotated corpus of bracketed sentences, called the Treebank. The project is a collaboration between the IBM Continuous Speech Recognition Group and the University of Pennsylvania Department of Computer Sciences. Our initial focus is the domain of computer manuals with a vocabulary of 3000 words. We use a Treebank that was developed jointly by IBM and the University of Lancaster, England.rnIn this past year, we have demonstrated that our automatically built parser produces parses without crossing brackets for 78% of a blind test set. This improves on the 69% that our manually built grammar-based parser produces.
机译:该项目的主要目的是通过从带括号的带注释的语料库称为树库中自动提取语法,从而开发出一种强大的,高性能的英语解析器。该项目是IBM连续语音识别小组与宾夕法尼亚大学计算机科学系之间的合作。我们最初的重点是词汇量为3000个单词的计算机手册。我们使用了由IBM和英国兰开斯特大学联合开发的Treebank。在过去的一年中,我们证明了我们自动构建的解析器可生成78%盲测试集的不带括号的解析器。这与我们手动构建的基于语法的解析器所产生的69%相比有所改善。

著录项

  • 来源
    《Human language technology》|1994年|456-456|共1页
  • 会议地点 Plainsboro NJ(US)
  • 作者

    Salim Roukos;

  • 作者单位

    IBM T.J. Watson Research Center P.O. Box 704 Yorktown Heights, NY 10598;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 计算机软件;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号