...
首页> 外文期刊>Knowledge and Information Systems >Summarization – compressing data into an informative representation
【24h】

Summarization – compressing data into an informative representation

机译:汇总–将数据压缩为内容丰富的表示形式

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

In this paper, we formulate the problem of summarization of a data set of transactions with categorical attributes as an optimization problem involving two objective functions – compaction gain and information loss. We propose metrics to characterize the output of any summarization algorithm. We investigate two approaches to address this problem. The first approach is an adaptation of clustering and the second approach makes use of frequent itemsets from the association analysis domain. We illustrate one application of summarization in the field of network data where we show how our technique can be effectively used to summarize network traffic into a compact but meaningful representation. Specifically, we evaluate our proposed algorithms on the 1998 DARPA Off-Line Intrusion Detection Evaluation data and network data generated by SKAION Corp for the ARDA information assurance program.
机译:在本文中,我们将具有分类属性的交易数据集的汇总问题公式化为涉及两个目标函数(压缩收益和信息损失)的优化问题。我们提出度量标准来表征任何汇总算法的输出。我们研究了两种方法来解决此问题。第一种方法是聚类的改编,第二种方法利用了来自关联分析域的频繁项集。我们说明了摘要在网络数据领域中的一种应用,其中我们展示了如何有效地利用我们的技术将网络流量汇总为紧凑但有意义的表示形式。具体来说,我们根据1998年DARPA离线入侵检测评估数据和SKAION Corp.为ARDA信息保证计划生成的网络数据评估我们提出的算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号