首页> 外文会议>Annual meeting of the American Society for Information Science and Technology >Data Mining for “Big Archives” Analysis: a Case Study
【24h】

Data Mining for “Big Archives” Analysis: a Case Study

机译:用于“大档案”分析的数据挖掘:一个案例研究

获取原文

摘要

We present a case of archival analysis using a combinationof data mining methods. The team of researchers, composedby archivists and computer scientists, used a collection ofdeclassified Department of State Cables as a case study. Themethods implemented included Support Vector Machine(SVM) and Association Rule Mining. Combined in ananalysis workflow, the results of the different methodsallowed the team to identify the different security classes,understand how they changed over time and generatedescriptions for the cables in each class. The interpretationof results also allowed understanding contextual aspects ofthe collection. Until now, the use of data mining for archivalanalysis and processing has not been thoroughly exploredby the archival community. This study constitutes a seminalroadmap to understand how to apply, interpret and integratedata mining with the archivists experience and judgment incollaboration with computer scientists. It proposes aninductive approach to archives analysis and the possibilityof verifying processing decisions.
机译:我们介绍了一个结合使用的档案分析案例 数据挖掘方法。研究团队组成 由档案管理员和计算机科学家使用, 解密了国家电缆部门的案例研究。这 实现的方法包括支持向量机 (SVM)和关联规则挖掘。结合在 分析工作流程,不同方法的结果 允许团队确定不同的安全级别, 了解它们如何随着时间变化并产生 每个类别的电缆说明。解释 的结果还使我们能够理解以下方面的内容: 集合。到目前为止,使用数据挖掘进行存档 分析和处理尚未彻底探索 由档案社区。这项研究构成了开创性的 了解如何应用,解释和集成的路线图 档案工作者的数据挖掘经验和判断力 与计算机科学家的合作。它提出了一个 归纳法进行档案分析及可能性 验证处理决策的过程。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号