首页> 美国政府科技报告 >Lucene for n-grams using the ClueWeb Collection
【24h】

Lucene for n-grams using the ClueWeb Collection

机译:Lucene使用ClueWeb Collection获取n-gram

获取原文

摘要

The ARSC team made modifications to the Apache Lucene engine to accommodate 'go words,' taken from the Google Gigaword vocabulary of n-grams. Indexing the Category 'B' subset of the ClueWeb collection was accomplished by a divide and conquer method, working across the separate ClueWeb subsets for 1, 2 and 3-grams.

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号