首页> 外文期刊>電子情報通信学会技術研究報告 >分散計算機環境における異常動作の原因の特定手法
【24h】

分散計算機環境における異常動作の原因の特定手法

机译:一种在分布式计算环境中识别异常行为原因的方法

获取原文
获取原文并翻译 | 示例
       

摘要

We propose a clustering system to diagnose distributed system by log data of system metrics, and a system that searches process including error causes. We use Naive Bayes and the Tree-augmented Naive Bayes, which extended from Naive Bayes, for clustering. Our system chooses proper metrics clustering node state from log data automatically, reshepes feature vector to refine clustering efficiency, and help administrator finding error causes by noticing process group. We evaluate this system in Intrigger platform.%本稿では、計算機クラスタの各ノードのCPU使用率や通信量などのログからノードの状態分類を行う手法として、Naive BayesとTree-augmented Naive Bayes の2つの確率モデルによる特徴抽出を用いるクラスタリング方法と、各クラスタに分類された原因となるプロセスの追求方法を提案、実装を行った。この手法により確率モデルから分類に用いる統計量の選択、特徴抽出ベクトルへの変換をしクラスタリングの正確性をあげ、調べたい分類状態のプロセスグループごとのまとまりの変化に着目し、原因となるプロセスを発見することができ、従来困難であった並列分散環境での異常発見を容易にすることが可能となった。本稿ではその実装と評価について述べる。
机译:我们提出了一个集群系统,该集群系统可以通过系统指标的日志数据来诊断分布式系统,并且可以搜索包含错误原因的过程。我们使用朴素贝叶斯和从朴素贝叶斯扩展而来的树增强朴素贝叶斯进行聚类。自动从日志数据中适当地度量聚类节点状态,重新构造特征向量以提高聚类效率,并通过通知进程组来帮助管理员发现错误原因。我们在Intrigger平台上对该系统进行了评估。%本文使用了计算机集群中每个节点的CPU使用率。作为一种从流量和流量等日志中对节点状态进行分类的方法,一种聚类方法是使用两个概率模型(朴素贝叶斯和树增强朴素贝叶斯)进行特征提取,并追踪导致每个聚类的过程提出并实现了一种方法。通过这种方法,我们从概率模型中选择要用于分类的统计数据,将其转换为特征提取向量以提高聚类的准确性,注意要研究的分类状态的每个过程组的内聚性变化,并确定引起过程。可以检测异常,并且可以容易地在并行和分布式环境中检测异常,这在过去是困难的。本文介绍了其实施和评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号