您现在的位置: 首页> 研究主题> 大规模数据

大规模数据

大规模数据的相关文献在1993年到2022年内共计293篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、工业经济 等领域,其中期刊论文158篇、会议论文8篇、专利文献564096篇;相关期刊113种,包括数字通信世界、计算机仿真、计算机科学等; 相关会议7种,包括2015全国高性能计算学术年会、第32届中国数据库学术会议、中华医学会第十九次全国医学信息学术会议等;大规模数据的相关文献由703位作者贡献,包括张立新、王士同、王磊等。

大规模数据—发文量

期刊论文>

论文:158 占比:0.03%

会议论文>

论文:8 占比:0.00%

专利文献>

论文:564096 占比:99.97%

总计:564262篇

大规模数据—发文趋势图

大规模数据

-研究学者

  • 张立新
  • 王士同
  • 王磊
  • 田玲
  • 罗光春
  • 詹剑锋
  • 付兴旺
  • 吴楠
  • 周宇
  • 王恩东
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 侯竞夫
    • 摘要: 1959年,计算机科学家E.W.Dijkstra提出了Dijkstra算法。Dijkstra算法是一种解决单源最短路径问题的贪心算法,其作用主要表现在解决有向图中的最短路径问题方面。但随着科学技术的发展,Dijkstra算法的应用领域得到了极大的扩展,“最短路径”也被赋予了全新的含义,不再单单指空间中的最短距离,同样也可以用来研究各种时间、经济、能量消耗问题。但是,随着研究问题的复杂化以及所研究数据规模的逐渐扩大,传统的串行Dijkstra算法计算量大、时间复杂度较高的问题也逐渐体现出来,影响着Dijkstra算法在诸多问题中的表现。而并行化计算不仅在计算大规模数据时表现优异,也非常契合Dijkstra算法的算法思想。
    • 潘莹丽; 刘飞; 刘展; 赵晓洛
    • 摘要: 大规模数据是需要新处理模式才能具有更强的洞察力和决策力的海量、高增长率和多样化的信息资产。分析海量数据的工作异常复杂,主要面临两个挑战:数据的难存储性和偏态性。基于此,文章主要研究以下两个问题:(1)将数据进行分布式存储,减轻单台机器的存储负担,采用尾期望回归分析偏态数据。(2)基于尾期望回归构造全局损失函数的一个交互有效的梯度增强型损失函数,为解决该损失函数的优化问题,提出修正的ADMM算法。模拟研究表明,在有限次主从机器之间交互次数下,提出的分布式计算方法得到的估计误差递减并趋于全局最优方法得到的估计误差。基于全国健康访谈调查(NHIS)数据的实证研究表明,提出的分布式计算方法对国民体重具有良好的预测性能。
    • 摘要: 四月1日中国科大在国产超算平台填补大气数值模拟空白。中国科学技术大学科研人员在新一代神威超级计算机上,首次实现了长达7天的全球3公里空间分辨率大气物理-化学全耦合数值模拟试验。该项研究工作基于新一代中国国产神威超算平台,在大规模数据读写速度、运行时效性等多个方面填补了中外大气数值模拟的空白,全面展现了新一代中国国产超级计算机软硬件系统的可靠性、稳定性和可用性,以及在其上构建全球高分辨率大气模拟系统的重大应用前景。
    • 石美丽
    • 摘要: 在信息化炙热的时代,对大量及大规模数据进行压缩往往是研究事物的第一步,而主成分分析作为信息压缩的重要手段之一,在模式识别、推荐系统、图像及视频处理等方面发挥着重要作用。本文在以方差代表信息量的基础上,分别构造了向量、矩阵、张量情形下的主成分,并分析了其特征向量在对应Hilbert空间的正交展开过程。且进一步讨论了三种情形下样本PCA的过程,探究重构过程中矩阵SVD和张量Tucker分解与矩阵PCA和张量PCA的关系。
    • 周欣
    • 摘要: 传粉昆虫的数量和多样性危机是一个亟待重视的问题。当然,作为科学家,要想确切得出传粉昆虫在大尺度范围下降的绝对性结论,需要通过严谨而大量的重复实验,积累具有统计学意义的大规模数据,然后严格分析,这是一个困难而漫长的过程。但是从保护生物学的角度来看,面对一个潜在的重大危机,我们宁可采取更谨慎的方式去预防,或者是减小它发生的可能性或者速度。
    • 刘知远; 林衍凯; 孙茂松
    • 摘要: 语义表示是自然语言处理的基础,我们需要将原始文本数据中的有用信息转换为计算机能够理解的语义表示,才能实现各种自然语言处理应用。表示学习旨在从大规模数据中自动学习数据的语义特征表示,并支持机器学习进一步用于数据训练和预测。以深度学习为代表的表示学习技术,能够灵活地建立对大规模文本、音频、图像、视频等无结构数据的语义表示,显著提升语音识别、图像处理和自然语言处理的性能,近年来引发了人工智能的新浪潮。本书是第一本完整介绍自然语言处理表示学习技术的著作。书中全面介绍表示学习技术在自然语言处理领域的最新进展,对相关理论、方法和应用进行了深入介绍,并展望了未来的重要研究方向。
    • 摘要: 2020年12月,国家发展改革委、中央网信办、工业和信息化部、国家能源局等四部门联合印发《关于加快构建全国一体化大数据中心协同创新体系的指导意见》(发改高技[2020]1922号),明确指出"加强全国一体化大数据中心顶层设计,对深化政企协同、行业协同、区域协同以及全面支撑各行业数字化升级和产业数字化转型具有重要意义";2021年5月,四部门又联合印发了《全国一体化大数据中心协同创新体系算力枢纽实施方案》(发改高技[2021]709号),国家发展改革委相关负责人就文件出台背景指出,随着各行业数字化转型升级进度加快,特别是5G、人工智能、物联网等新技术的快速普及应用,全社会数据总量爆发式增长,数据存储、计算、传输和应用的需求大幅提升,数据中心已成为支撑各行业"上云用数赋智"的重要新型基础设施。本期专题"国家数据中心"聚焦全国一体化大数据中心建设,旨在探讨全国一体化大数据中心顶层设计、数据资源储备体系、超大规模数据要素市场体系以及粤港澳地方大数据中心建设等关键问题。
    • 摘要: 大数据时代奔涌而来,AI、云计算、大数据、物联网等需求不断增长,数据中心将变得更大、更复杂。作为数据中心的动力心脏,供配电系统需要更加可靠的UPS来保障数据中心的不间断运行。先控电气作为专业的UPS系统供应商,根据大型数据中心的业务需求定制“绿色电源解决方案”。在可靠运行的前提下,还能实现节能降耗、快速部署、随需扩容等功能。
    • 朴承哲
    • 摘要: 为了提高大规模非结构化数据的分布式存储能力,提出基于空间网格聚类的大规模非结构化数据分布式存储方法.构建大规模非结构化数据多维空间分布式融合模型,采用模糊中心权重聚类的方法进行数据的线性加权控制处理,通过样本扩展和密度融合的方法提取数据特征,采用选择随机性特征分析方法实现对数据特征空间划分,并利用空间网格聚类方法实现大规模非结构化数据分布式存储.仿真结果表明,该方法的执行时间较短,数据聚类准确性较高.该方法有效提高了大规模非结构化数据分布式存储性能,实际应用效果好.
    • 陆琦; 肖峰
    • 摘要: 文章从PDM系统与其他系统的集成内容、集成方式、集成难点和技术选型等方面全面地阐述了SPDM系统在数据集成方面的应用模式.旨在总结SPDM系统与其他系统集成技术的选择和实现,分析其中的得失优劣,供后续开发系统参考.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号