首页> 外文会议> >The TaxGen framework: automating the generation of a taxonomy for alarge document collection
【24h】

The TaxGen framework: automating the generation of a taxonomy for alarge document collection

机译:TaxGen框架:自动生成分类标准大文件收集

获取原文

摘要

Text mining is an active area of research and development, whichcombines and expands techniques found in related areas like informationretrieval, computational linguistics and data mining to perform ananalysis of large corpora of digital documents. This paper describes theTaxGen text mining project carried out at the IBM Software DevelopmentLab. at Boeblingen, Germany. The goal of TaxGen was the automaticgeneration of a taxonomy for a collection of previously unstructureddocuments, namely a set of 73,000 news wire documents spanning one year
机译:文本挖掘是研究和开发的活跃领域, 结合并扩展在相关领域(如信息)中发现的技术 检索,计算语言学和数据挖掘以执行 大型数字文档的分析。本文介绍了 在IBM软件开发公司进行的TaxGen文本挖掘项目 实验室在德国的伯布林根。 TaxGen的目标是自动 为先前非结构化的集合生成分类法 文档,即一组为期7年的73,000条新闻专线文档

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号