首页> 外国专利> K- Dataset De-identification Method and Apparatus Using K-anonymity Model

K- Dataset De-identification Method and Apparatus Using K-anonymity Model

机译:使用k匿名模型的k数据集去识别方法和装置

摘要

The present invention relates to a dataset deidentification method using a K-anonymity model and a device thereof. According to the present invention, the dataset deidentification method comprises: a step of confirming attribute value distribution for each column corresponding to a quasi-identifier attribute with respect to a dataset to be deidentified; a first processing step of considering the attribute value distribution for each column to deidentify each column of the dataset to be deidentified; a step of grouping a record with the identical attribute value into a record group when the number of records with the identical attribute value of one or more columns is K or more in the first-processed dataset to be deidentified; and a step of considering attribute value distribution of the column with a non-identical attribute value in the record group to deidentify the column with the non-identical attribute value so as to satisfy K-anonymity requirements. Accordingly, the present invention provides advantages capable of minimizing data crush while the K-anonymity requirements are satisfied and increasing a deidentification speed.
机译:本发明涉及一种使用K匿名模型的数据集去识别方法及其设备。根据本发明,数据集去识别方法包括:确认关于要识别的数据集的与准识别器属性相对应的每一列的属性值分布的步骤;第一处理步骤,考虑每一列的属性值分布,以去识别待识别数据集的每一列;当要被识别的第一处理数据集中具有一或多个列的相同属性值的记录数目为K或更多时,将具有相同属性值的记录分组为记录组的步骤;考虑记录组中具有不相同属性值的列的属性值分布,以识别具有不相同属性值的列以满足K匿名性要求的步骤。因此,本发明提供了能够在满足K匿名性要求的同时最小化数据拥挤并提高识别速度的优点。

著录项

  • 公开/公告号KR20200026559A

    专利类型

  • 公开/公告日2020-03-11

    原文格式PDF

  • 申请/专利权人 IRCOMPANY CO. LTD.;

    申请/专利号KR20180104660

  • 发明设计人 PARK SEONG GYU;

    申请日2018-09-03

  • 分类号G06F21/62;G06F21/60;

  • 国家 KR

  • 入库时间 2022-08-21 11:07:42

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号