首页> 外文会议>IEEE International Conference on Data Engineering >Logan: A Distributed Online Log Parser
【24h】

Logan: A Distributed Online Log Parser

机译:逻辑:分布式在线日志解析器

获取原文

摘要

Logs serve as a critical tool for debugging and monitoring applications. However, gaining insights from unstructured logs is difficult. Hence, many log management and analysis applications first parse logs into structured templates. In this paper, we train a data-driven log parser on our new Apache Spark dataset, the largest application log dataset yet. We implement a distributed online algorithm to accommodate for the large volume of data. We also devise a new metric for evaluation of parsers when labeled data is unavailable. We show that our method generalizes over diverse datasets without any parameter tuning or domain-specific inputs from the user. When evaluated on publicly available HDFS dataset our method performs 13x faster than the previous state-of-the-art.
机译:日志作为调试和监视应用程序的关键工具。但是,难以获得非结构化日志的洞察。因此,许多日志管理和分析应用程序首先将日志解析为结构化模板。在本文中,我们在新的Apache Spark DataSet上培训数据驱动的日志解析器,该数据集是最大的应用程序日志数据集。我们在分布式在线算法实现以适应大量数据。我们还将新的度量标准设计在标记数据不可用时评估解析器。我们表明我们的方法通过用户的任何参数调整或特定于域的输入,推广了各种数据集。在公开可用的HDFS DataSet上进行评估时,我们的方法比以前的最先进的速度更快地执行13倍。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号