首页> 外国专利> CLUSTERING AND CLUSTER TRACKING OF CATEGORICAL DATA

CLUSTERING AND CLUSTER TRACKING OF CATEGORICAL DATA

机译:分类数据的聚类和群集跟踪

摘要

An approach for clustering large sets of categorical data involves iteratively ordering the data points, partitioning the data into blocks based on the ordering, and clustering the data points within each block, where different iterations use different orderings and, thus, different partitionings. In some embodiments, the data points are represented by multi-dimensional categorical vectors, and the orderings are based on permutations of the categorical dimensions. The iterative clustering may be repeated for multiple successive time windows to track the clusters. Various applications of the disclosed clustering approach, including for cyber security, are also described.
机译:用于聚类大组分类数据的方法涉及迭代地排序数据点,基于排序地将数据划分为块,以及群集每个块内的数据点,其中不同的迭代使用不同的排序,因此,因此,不同的分区。 在一些实施例中,数据点由多维分类向量表示,并且排序基于分类维度的置换。 可以针对多个连续时间窗口重复迭代聚类以跟踪群集。 还描述了所公开的聚类方法的各种应用,包括网络安全性。

著录项

  • 公开/公告号WO2022005664A1

    专利类型

  • 公开/公告日2022-01-06

    原文格式PDF

  • 申请/专利权人 MICROSOFT TECHNOLOGY LICENSING LLC;

    申请/专利号WO2021US34677

  • 发明设计人 BETSER MICHAEL A.;

    申请日2021-05-28

  • 分类号H04L29/06;G06N20;G06F16/35;

  • 国家 US

  • 入库时间 2022-08-24 23:16:29

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号