首页> 外文会议>ACM symposium on document engineering >On Helmholtz's Principle for Documents Processing
【24h】

On Helmholtz's Principle for Documents Processing

机译:关于Helmholtz的文件处理原则

获取原文
获取外文期刊封面目录资料

摘要

Keyword extraction is a fundamental problem in text data mining and document processing. A large number of document processing applications directly depend on the quality and speed of keyword extraction algorithms. In this article, a novel approach to rapid change detection in data streams and documents is developed. It is based on ideas from image processing and especially on the Helmholtz Principle from the Gestalt Theory of human perception. Applied to the problem of keywords extraction, it delivers fast and effective tools to identify meaningful keywords using parameter-free methods. We also define a level of meaningfulness of the keywords which can be used to modify the set of keywords depending on application needs.
机译:关键字提取是文本数据挖掘和文档处理中的一个基本问题。大量文档处理应用程序直接取决于关键字提取算法的质量和速度。在本文中,开发了一种新的数据流和文档中快速变化检测的新方法。它基于图像处理的思想,特别是从人类感知的最大值理论的亥姆霍兹原则。应用于关键字提取问题,它可以使用可参数方法提供快速且有效的工具来识别有意义的关键字。我们还定义了关键字的有意义程度,该关键字可根据应用程序使用来修改一组关键字。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号