您现在的位置: 首页> 研究主题> 数据发布

数据发布

数据发布的相关文献在1998年到2023年内共计1145篇,主要集中在自动化技术、计算机技术、经济计划与管理、工业经济 等领域,其中期刊论文736篇、会议论文24篇、专利文献553458篇;相关期刊475种,包括房地产导刊、测绘与空间地理信息、通信学报等; 相关会议24种,包括中国制造业产品创新数字化国际峰会、上海市科学技术协会第十届学术年会暨上海市航空学会2012年学术年会、中国电力规划设计协会供用电设计技术交流会等;数据发布的相关文献由1836位作者贡献,包括李先贤、刘鹏、王利娥等。

数据发布—发文量

期刊论文>

论文:736 占比:0.13%

会议论文>

论文:24 占比:0.00%

专利文献>

论文:553458 占比:99.86%

总计:554218篇

数据发布—发文趋势图

  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 郑剑; 杨立聪
    • 摘要: 针对基于随机投影的差分隐私算法中存在直接对降维数据直接添加噪声导致基于欧氏距离数据挖掘中数据可用性较差的问题,提出了一种基于奇异值分解的差分隐私算法。该算法首先对高维社交网络的数据利用随机投影进行降维,然后对降维后的数据进行奇异值分解并对奇异值加入高斯噪声,最后通过奇异值分解逆运算生成待发布矩阵。该算法利用的奇异值矩阵是一个仅有主对角线上有值的矩阵,值的个数为矩阵的秩,与直接对降维后的数据直接添加高斯噪声相比,对奇异值矩阵中的值添加高斯噪声能有效地降低噪声的加入量。理论证明该算法满足差分隐私,并设计了欧氏距离差实验和谱聚类实验用于分析算法的数据可用性,实验结果表明该算法的数据可用性高于基于奇异值分解的差分隐私算法。
    • 王舒
    • 摘要: [目的/意义]调查我国各类型科学数据仓储的服务现状,分析存在的问题,为今后的发展提供对策与建议。[方法/过程]利用文献分析法确定科学数据仓储的选择标准,选出国家人口医学科学数据中心等国内7个科学数据仓储,利用网络调查法从服务目标、服务对象、服务功能、服务方式、服务资金来源6个方面对所选科学数据仓储进行调查分析。[结果/结论]我国各类型科学数据仓储发展不平衡,更侧重于个人用户,忽视了机构用户,附加服务和推广服务等特色服务方面较为欠缺,资金来源单一。基于此,国家应制定相关政策,高校应加快建设本机构科学数据仓储,科学数据仓储应拓宽服务对象和资金来源渠道,完善服务功能。
    • 刘宇涵; 陈红; 刘艺璇; 赵丹; 李翠平
    • 摘要: 如今,图数据已经被广泛地应用于现实生活与科学研究当中,有巨大的使用和研究价值.但与此同时,针对图数据的收集与发布中也存在巨大的隐私风险.如何在保护图隐私的同时,发布与收集可用图数据,是目前个人、企业、政府等面临的重大挑战.本文首先从隐私信息所包含的内容、不同的隐私泄露场景,以及敌手模型三个方面深入地剖析了图数据在使用中存在的隐私风险,然后重点从攻击和防御两个角度展开介绍.针对攻击而言,本文分析了当前可行的图数据隐私攻击与攻击量化算法及其算法原理.针对防御而言,本文总结了简单匿名、图修改、聚类,以及差分隐私四种图数据隐私防御技术;分析了集中与分布两种数据存储场景下,不同类型图数据使用的各类隐私防御算法,以及数据隐私性与可用性度量方法.最后本文综合已有的研究成果,指出了图数据上隐私保护研究当前存在的问题、面临的挑战,及未来的研究方向.
    • 曹宪; 赵雪昆
    • 摘要: 在数字化时代,数据已成为重要资源,其对国家治理、经济发展、社会秩序、人民生活的影响越来越大。如何保障数据的使用安全、共享安全,是目前信息安全研究领域的一个重要课题。文章重点分析了隐私保护技术以及多种机器学习方法的隐私保护技术在数据发布和数据挖掘中的应用。在数据发布方面,可以采用聚类算法、差分隐私算法;在数据挖掘方面,主要利用差分隐私以满足数据挖掘领域的高层次隐私需求;在联邦学习方面,针对本地差分、中心差分、分布式差分进行了介绍。最后,文章介绍了隐私保护在其他方面的应用,并展望了未来的研究方向。
    • 朱徐亚
    • 摘要: 为了解决维度灾难所引起的隐私保护数据发布计算复杂度高、可用性低的问题,提出基于差分隐私采样机制和贝叶斯网络的DPSM-Bayes算法。利用贝叶斯网络模型,将高维联合概率分布转化为多个低维边缘概率分布,结合差分隐私采样机制和更适合高维概率分布加噪的IMLaplace机制,生成可用性更高的高维合成数据集。实验结果证明,在提供相同差分隐私保护的前提下,DPSM-Bayes算法能够有效地处理高维数据集的发布问题,与现有的方法相比发布的数据集具有更高的质量和可用性。
    • 丁建立; 杜天天
    • 摘要: 为使数据管理者可以发布数据集供研究人员进行挖掘分析,对数据集采用满足差分隐私的保护算法,但其中会加入大量噪声,破坏数据可用性,因此,提出一种基于聚类的差分隐私民航旅客数据发布算法。改进聚类算法,按照数据类型的不同,对数值型属性和分类型属性分别选用不同的距离计算方法,将更可能相关的记录分为一组,降低差分隐私敏感度,结合聚类结果形成的簇,采用差分隐私保护技术对数据记录进行加噪。实验结果表明,算法能够在降低信息损失的同时防止信息泄露。
    • 摘要: 近日,北京大学“全国高校毕业生就业状况调查”相关结果数据发布。数据显示,学历越高收入越多。2021年博士、硕士、本科、专科的月起薪算数平均值分别为14823元、10113元、5825元、3910元;中位数分别为15000元、9000元、5000元、3500元。
    • 摘要: 项目采用降雨径流模型对蒋坝站水位和运河站流量进行了确定性预报,在此基础上开展了洪水概率预报方案研制工作,针对不同预见期及不同量级条件下洪水预报误差规律存在的不-致特征,将洪水分类为高-中-低3类,挖掘了每一类洪水预报的统计规律,建立了预报误差分布模型,择优选取水文不确定性模型,并进行了模块化与集成,开发了应用系统。系统采用B/S架构,建设了数据发布展示平台;调用概率预报模型数据接口,实现了对实时数据、经验预报成果、概率预报成果.
    • 朱骁; 杨庚
    • 摘要: 为了让不同组织在保护本地敏感数据和降维后发布数据隐私的前提下,联合使用PCA进行降维和数据发布,提出横向联邦PCA差分隐私数据发布算法。引入随机种子联合协商方案,在各站点之间以较少通信代价生成相同随机噪声矩阵。提出本地噪声均分方案,将均分噪声加在本地协方差矩阵上。一方面,保护本地数据隐私;另一方面,减少了噪声添加量,并且达到与中心化差分隐私PCA算法相同的噪声水平。理论分析表明,该算法满足差分隐私,保证了本地数据和发布数据的隐私性,较同类算法噪声添加量降低。实验从隐私性和可用性角度评估该算法,证明该算法与同类算法相比具有更高的可用性。
    • 黄景; 柳毅
    • 摘要: 针对稀疏环境下的移动对象轨迹数据经匿名处理后可用性低的问题,提出一种稀疏环境下基于假轨迹的轨迹隐私保护算法。在本文算法中,考虑了移动对象所处的地理环境,将轨迹的整体方向和轨迹间距作为选择假轨迹的重要依据。此外,还提出了使用访问概率的概念来平衡匿名和数据可用性,从而实现轨迹数据匿名。基于移动对象的轨迹数据集进行实验与分析,实验结果表明,本文算法在满足轨迹数据匿名需求的情况下有更高的数据可用性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号