首页> 外文会议>IEEE international conference on data engineering >Generating private synthetic databases for untrusted system evaluation
【24h】

Generating private synthetic databases for untrusted system evaluation

机译:生成私有综合数据库以进行不受信任的系统评估

获取原文

摘要

Evaluating the performance of database systems is crucial when database vendors or researchers are developing new technologies. But such evaluation tasks rely heavily on actual data and query workloads that are often unavailable to researchers due to privacy restrictions. To overcome this barrier, we propose a framework for the release of a synthetic database which accurately models selected performance properties of the original database. We improve on prior work on synthetic database generation by providing a formal, rigorous guarantee of privacy. Accuracy is achieved by generating synthetic data using a carefully selected set of statistical properties of the original data which balance privacy loss with relevance to the given query workload. An important contribution of our framework is an extension of standard differential privacy to multiple tables.
机译:当数据库供应商或研究人员正在开发新技术时,评估数据库系统的性能至关重要。但是,此类评估任务严重依赖于实际数据和查询工作负载,由于隐私限制,研究人员通常无法获得这些工作负载。为了克服这一障碍,我们提出了一个发布综合数据库的框架,该框架可以准确地对原始数据库的选定性能属性进行建模。通过提供正式,严格的隐私保证,我们改进了合成数据库生成方面的先前工作。通过使用原始数据的精心选择的一组统计属性生成合成数据来实现准确性,这些属性可以在隐私丢失与给定查询工作量的相关性之间取得平衡。我们框架的重要贡献是将标准差异隐私扩展到多个表。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号