首页> 外国专利> K- Dataset De-identification Method and Apparatus Using K-anonymity Model

K- Dataset De-identification Method and Apparatus Using K-anonymity Model

机译:使用k匿名模型的k数据集去识别方法和装置

摘要

The present invention relates to a method and apparatus for de-identifying a data set using a K-anonymity model, and the method according to the present invention comprises: checking a distribution of attribute values for each column corresponding to a quasi-identifier attribute for a non-identifying target data set , The first processing step of de-identification processing for each column of the de-identification target data set considering the distribution of the attribute values for each column, and the record with the same attribute value of one or more columns in the first-processed de-identification target data set If there are K or more, grouping records with the same attribute value into a group of records, and taking into account the distribution of attribute values in a column that does not have the same attribute value in the record group, the attribute values are not equal to satisfy the K-anonymity requirement. And subjecting the column to de-identification. According to the present invention, the K-anonymity requirement is satisfied, but data crushing can be minimized, and there is an advantage of improving the speed of de-identification processing.
机译:本发明涉及一种使用K-匿名模型来去识别数据集的方法和装置,并且根据本发明的方法包括:检查与用于以下目的的准标识符属性相对应的每列的属性值的分布。非识别目标数据集,考虑到每一列的属性值的分布以及具有相同属性值的记录,对不识别目标数据集的每一列进行去识别处理的第一处理步骤首先处理的取消标识目标数据集中的更多列如果存在K个或更多,则将具有相同属性值的记录分组到一组记录中,并考虑不包含列的属性值在列中的分布记录组中的属性值相同,则属性值不等于满足K匿名性要求。并对列进行身份识别。根据本发明,满足了K匿名性要求,但是可以最小化数据粉碎,并且具有提高去识别处理的速度的优点。

著录项

  • 公开/公告号KR102126386B1

    专利类型

  • 公开/公告日2020-06-24

    原文格式PDF

  • 申请/专利权人 (주)아이알컴퍼니;

    申请/专利号KR20180104660

  • 发明设计人 박성규;

    申请日2018-09-03

  • 分类号G06F21/62;G06F21/60;

  • 国家 KR

  • 入库时间 2022-08-21 11:04:22

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号