首页> 外文期刊>International Journal on Document Analysis and Recognition >Multimodal page classification in administrative document image streams
【24h】

Multimodal page classification in administrative document image streams

机译:行政文档图像流中的多模式页面分类

获取原文
获取原文并翻译 | 示例
       

摘要

In this paper, we present a page classification application in a banking workflow. The proposed architecture represents administrative document images by merging visual and textual descriptions. The visual description is based on a hierarchical representation of the pixel intensity distribution. The textual description uses latent semantic analysis to represent document content as a mixture of topics. Several off-the-shelf classifiers and different strategies for combining visual and textual cues have been evaluated. A final step uses an n-gram model of the page stream allowing a finer-grained classification of pages. The proposed method has been tested in a real large-scale environment and we report results on a dataset of 70,000 pages.
机译:在本文中,我们介绍了银行工作流程中的页面分类应用程序。提出的体系结构通过合并视觉和文本描述来表示管理文档图像。视觉描述基于像素强度分布的分层表示。文本描述使用潜在语义分析将文档内容表示为主题的混合。已经评估了几种现成的分类器以及将视觉和文字提示结合在一起的不同策略。最后一步使用页面流的n元语法模型,可以对页面进行更细粒度的分类。所提出的方法已经在真实的大规模环境中进行了测试,我们在70,000页的数据集上报告了结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号