首页> 外国专利> Augmenting datasets with selected de-identified data records

Augmenting datasets with selected de-identified data records

机译:使用选定的DE-entedified数据记录增强数据集

摘要

A computer system utilizes a dataset to support a research study. Regions of interestingness are determined within a model of data records of a first dataset that are authorized for the research study by associated entities. Data records from a second dataset are represented within the model, wherein the data records from the second dataset are relevant for supporting objectives of the research study. Data records from the second dataset that fail to satisfy de-identification requirements are removed. A resulting dataset is generated that including the first dataset records within a selected region of interestingness and selected records of the second dataset within the same region. The second dataset records within the resulting dataset are de-identified based on the de-identification requirements. Embodiments of the present invention further include a method and program product for utilizing a dataset to support a research study in substantially the same manner described above.
机译:计算机系统利用数据集来支持研究学习。 有趣的区域是在第一个数据集的数据记录的模型中确定,该数据记录被相关实体授权研究研究。 来自第二数据集的数据记录在模型内表示,其中来自第二数据集的数据记录与支持研究研究的目标相关。 删除了未能满足去识别要求的第二个数据集的数据记录。 生成产生的数据集,其包括在同一区域内所选择的有趣区域和所选择的第二数据集的所选记录中的第一数据集记录。 基于去识别要求,将在生成的数据集中的第二个数据集记录进行解识别。 本发明的实施例还包括用于利用数据集以基本上相同的方式支持研究研究的方法和程序产品。

著录项

  • 公开/公告号US11093646B2

    专利类型

  • 公开/公告日2021-08-17

    原文格式PDF

  • 申请/专利权人 INTERNATIONAL BUSINESS MACHINES CORPORATION;

    申请/专利号US201916449682

  • 发明设计人 ARIS GKOULALAS-DIVANIS;

    申请日2019-06-24

  • 分类号G06F21/62;G06F21/60;

  • 国家 US

  • 入库时间 2022-08-24 20:37:30

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号