首页> 外文会议>Advanced Information Management and Service (ICIPM), 2011 7th International Conference on >Automatic metadata extraction and classification of spreadsheet documents based on layout similarity

【24h】

Automatic metadata extraction and classification of spreadsheet documents based on layout similarity

机译：基于布局相似性的电子表格文档自动元数据提取和分类

获取原文

获取原文并翻译 | 示例

页面导航

摘要
著录项
相似文献
相关主题

摘要

Effective information search is becoming a key success for business. Metadata is an essential part of modern information system since it helps people to find relevant documents from disparate repositories. Automatic document metadata extraction has received attention in recent years as it is an important task in generating powerful search indices to support effective information search. The objective of this paper is to propose an innovative method that automatically performs metadata extraction and classification on the spreadsheets having layout similar to that of a given sample spreadsheet whose metadata is previously defined. Metadata classification is based on document types (e.g. purchase order, sales report etc) and data context (e.g. customer name, order date etc) so that users can define the meanings of the keywords in the search query. Therefore, search engine of this work returns the search results that match user search intention more than those of conventional keyword search engines.

机译：有效的信息搜索正在成为企业的关键成功。元数据是现代信息系统的重要组成部分，因为它可以帮助人们从不同的存储库中找到相关的文档。近年来，自动文档元数据提取已受到关注，因为它是生成强大的搜索索引以支持有效信息搜索的重要任务。本文的目的是提出一种创新的方法，该方法可以自动对具有与先前定义了元数据的示例电子表格进行布局的电子表格进行元数据提取和分类。元数据分类基于文档类型（例如采购订单，销售报告等）和数据上下文（例如客户名称，订单日期等），以便用户可以定义搜索查询中关键字的含义。因此，这项工作的搜索引擎比传统的关键字搜索引擎返回的搜索结果更符合用户搜索意图。

著录项

来源
《Advanced Information Management and Service (ICIPM), 2011 7th International Conference on 》|2011年|p.38- 43|共6页
会议地点 Jeju Island(KR)
作者
Chatvichienchai Somchai;
展开▼
作者单位

Dept. of Information and Media Studies, University of Nagasaki, 1-1-1 Manabino, Nagayo Cho, Nishisonogi Gun, Nagasaki, 851-2195, Japan;

展开▼
会议组织
原文格式 PDF
正文语种 eng
中图分类数据处理、数据处理系统 ;
关键词

相似文献

外文文献
中文文献
专利

1. Visual Similarity Based Document Layout Analysis [J] . Di Wen, Xiao-Qing Ding Journal of Computer Science & Technology . 2006 ,第3期

机译：基于视觉相似度的文档布局分析
2. Visual Similarity Based Document Layout Analysis [J] . Di Wen, Xiao-Qing Ding 计算机科学技术学报（英文版） . 2006 ,第003期

机译：基于视觉相似度的文档布局分析
3. Deep Learning-based Extraction of Algorithmic Metadata in Full-Text Scholarly Documents [J] . Iqra Safder, Saeed-Ul Hassan, Anna Visvizi, Information Processing & Management . 2020 ,第6期

机译：全文学术文档中算法元数据的深度学习提取
4. Automatic metadata extraction and classification of spreadsheet documents based on layout similarity [C] . Chatvichienchai Somchai International Conference on Advanced Information Management and Service . 2011

机译：基于布局相似性的自动元数据提取和电子表格文档分类
5. Data mining revision controlled document history metadata for automatic classification. [D] . Maass, Dustin. 2013

机译：数据挖掘修订版本控制的文档历史记录元数据，用于自动分类。
6. A System for Automated Extraction of Metadata from Scanned Documents using Layout Recognition and String Pattern Search Models [O] . Dharitri Misra, Siyuan Chen, George R. Thoma -1

机译：使用布局识别和字符串模式搜索模型从扫描文档中自动提取元数据的系统
7. Classification of Document Page Images Based on Visual Similarity of Layout Structures [O] . Christian K. Shin, David S. Doermann 2000

机译：基于布局结构视觉相似性的文档页面图像分类

Automatic metadata extraction and classification of spreadsheet documents based on layout similarity

摘要

著录项

相似文献

相关主题

期刊订阅