【24h】

A General Framework for Fast Textual Document Preprocessing

机译:快速文本文档预处理的通用框架

获取原文
获取原文并翻译 | 示例

摘要

Due to the large amount of textual documents available from heterogeneous sources. Knowledge Discovery in Text (KDT) has emerged as a challenging application. A critical phase of a KDT Process is the Pre-processing phase. In this work we present a framework for textual document Pre-Processing aimed at the extraction of linguistic, syntactic and structural relevant features. Further, we describe OPM, a software developed by Exeura s.r.l., that efficiently implements the framework based on a parallel processing technique.
机译:由于可从不同来源获得大量文本文件。文本知识发现(KDT)已成为具有挑战性的应用程序。 KDT流程的关键阶段是预处理阶段。在这项工作中,我们提出了文本文档预处理的框架,旨在提取语言,句法和结构相关特征。此外,我们介绍了由Exeura s.r.l.开发的OPM软件,该软件可以有效地基于并行处理技术来实现框架。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号