数据分块
数据分块的相关文献在1996年到2023年内共计186篇,主要集中在自动化技术、计算机技术、测绘学、无线电电子学、电信技术
等领域,其中期刊论文100篇、会议论文10篇、专利文献547079篇;相关期刊79种,包括海洋测绘、电脑知识与技术、计算机工程等;
相关会议10种,包括2013年全国环境建模与仿真技术学术交流会议、第一届全国服务计算学术会议、第二十一届海洋测绘综合性学术研讨会等;数据分块的相关文献由470位作者贡献,包括A.R.萨勒、刘胜兰、周儒荣等。
数据分块—发文量
专利文献>
论文:547079篇
占比:99.98%
总计:547189篇
数据分块
-研究学者
- A.R.萨勒
- 刘胜兰
- 周儒荣
- 周可
- 杨莹
- 涂传勇
- 王芳
- 陈建文
- 于雪莲
- 亚历山大·安得烈耶维奇·莫尔多维安
- 代亚非
- 伍淳华
- 何王全
- 冯思伟
- 刘冬
- 刘建毅
- 刘璐铭
- 卜晓明
- 史玉良
- 叶选新
- 叶鹏迪
- 吕梦雅
- 吴世雄
- 吴俊
- 吴江煌
- 吴波
- 周云
- 周伟
- 周洁
- 唐勇
- 唐杰
- 唐永昊
- 姚文斌
- 尹可挺
- 尼古莱伊·安得烈耶维奇·莫尔多维安
- 尼古莱伊·维克托罗维奇·萨乌卢科夫
- 张丽艳
- 张亮
- 张军
- 张坤
- 张大为
- 张帆
- 张恒
- 张扬
- 张永敏
- 张江陵
- 戴宪华
- 文江
- 朱宝山
- 朱胡飞
-
-
蔡伊娜;
包先雨;
林燕奎;
彭锦学;
彭智彬;
林泳奇;
李俊霖;
郭云
-
-
摘要:
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型。提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点。与已有的BERT-BAC模型相比,在确保较高F;值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性。
-
-
侯开茂;
韩庆敏;
吴云峰;
黄兵;
张久发;
柴处处
-
-
摘要:
随着数字科学技术的发展,各领域需要传输和存储的数据量急剧上升。然而传输和存储的数据中重复数量占据了很大的比例,这不仅会增加使用数据的成本,也会影响处理数据的效率。域名是一种存储量大而且对处理速率有极高要求的数据,为了节约域名解析系统的存储成本,提高传输效率,本文在原有数据去重技术的基础上,引入了Simhash算法,结合域名数据的结构特征,改进数据分词和指纹值计算方式,提出了一种基于Simhash算法的重复域名数据去重方法。实验结果表明,相比于传统的数据去重技术,该方法对删除重复域名数据效率更高,具有较好的实际应用价值。
-
-
刘双;
钱澄澄;
周聪;
石婉雯
-
-
摘要:
数据作为智慧服务的基础,应在智慧图书馆建设中占据主导地位。围绕数据,借助技术手段凝聚与激发图书馆智慧,为满足用户多样化需求提供各种便捷的智慧服务。文章在全方位、立体化探析智慧图书馆数据体系及其作用的基础上,融合图书馆人、资源、空间、设备(技术)、服务与管理六大要素,开展了智慧图书馆数据分块研究,通过将数据划分为非交互数据块、交互数据块以及深度交互数据块,构建了智慧图书馆数据体系、技术手段与智慧服务三者之间的映射关系,理顺了智慧图书馆数据到技术再到服务转换的价值实现逻辑,为建设智慧图书馆展提供思考与借鉴,以指导应用实践。并基于智慧图书馆可持续发展理念,提出了构建数据分块标准体系、完善数据分块来源结构、打造数据分块精深产品的可持续发展策略。
-
-
明显诚;
许博
-
-
摘要:
传统的全地形车覆盖件表面复杂曲面拟合算法拟合精度较差,为此设计一种改进的全地形车覆盖件表面复杂曲面拟合算法.采用三坐标测量机对全地形车覆盖件表面复杂曲面数据采样,对数据对齐与最大化简化处理,获得可信赖函数,采用插值分割算法对采集到的数据进行分割,判定全地形车覆盖件表面边界光顺区域,采用最小二乘法对复杂曲面拟合,采样矩阵形式,将基于最小二乘问题转化为线性系统,得到最终的全地形车覆盖件表面复杂曲面拟合结果.实验结果证明,此次设计的全地形车覆盖件表面复杂曲面拟合算法比传统算法拟合精度高,解决了传统算法精度低的问题.
-
-
肖峰
-
-
摘要:
为提高光栅传感网络数据分块压缩效果,设计了基于LZW算法的高负荷光栅传感网络数据分块无损压缩方法.在构建存储结构模型的基础上,提取高负荷光栅传感网络数据的关联谱特征量,经数据分块融合处理后,结合参数多分辨重构方法实现对数据的分块加窗处理,并根据窗函数检测结果构建特征压缩子空间调度模型;在均衡的窗口中,采用多尺度的LZW算法实现对高负荷光栅传感网络数据的特征分解和分块压缩.仿真结果表明:该方法分块融合匹配能力较强,有效提高了数据的存储空间.
-
-
解志刚;
谭笑;
辛宪会;
闫军伟
-
-
摘要:
为在空中三角测量模型较差检测中形象快速标注误差超限点、超限区域,直观揭示误差全局区域联系,给空中三角测量补加连接点提供指引,提高空中三角测量作业效率和精度,结合逐点插入法和数据分块思想改进Delaunay三角网构网算法,提出了一种空中三角测量模型较差平面显示方法,利用Delaunay三角网的优良网拓扑关系显示超限点并推荐误差超限范围。以84景规模实际无控空中三角测量工程对该方法进行验证,结果表明该方法能够快速显示空中三角测量模型较差超限点和区域,指示补点区域,有助于揭示空中三角测量模型较差分布规律,辅助空中三角测量修正。该方法可为空中三角测量模型较差检测实际工程新问题提供高效实践方案。
-
-
景慎艳;
刘松迪
-
-
摘要:
为解决传统基于贝叶斯理论的概率模糊聚类(BayesianFuzzyClustering,BFC)算法在处理大规模数据集聚类时的时间开销和存储代价瓶颈,提出基于数据分块的单程自适应加权BFC算法,算法在大规模数据集分块的基础上,设计了基于数据加权的改进BFC算法,用于数据分块内数据聚类,以挑选出对聚类贡献最具代表的标识数据及其自适应权值,在块间迭代聚类过程中,将标识数据及其权值合并到下一数据块中并参与聚类,从而将上一数据块的聚类信息有效地传递到下一数据块中,最后分析算法的收敛性和时间复杂度。实验结果表明,算法在继承传统BFC算法良好聚类性能基础上,减少计算复杂度,有效提高聚类效率,适用于大规模数据集聚类。
-
-
付鋆;
汪浩;
陈运晶
-
-
摘要:
为了提高大量信息数据快速分析的能力,设计了一种通过内容分块技术来优化层次化冗余去重过程的方法.先分层处理元数据索引表,再以分层方式完成文件级与数据块级冗余去重的过程,之后为数据块级设置了智能化程度更高以及具备更优性能的内容分块优化算法.重点分析了通过内容分块方式实现的层次化去冗优化方案,同时对其开展了系统性测试.根据测试结果评价了各算法处理性能.结果 表明,该设计的优化方案可以达到更智能的程度并获得更优的处理效果.
-
-
张玉强;
赵萌;
梁星宇;
于佳炜
-
-
摘要:
针对常用隐秘算法能被通用隐秘分析手段检测的问题,基于比例嵌入和标记位的方法及数据分块嵌入机制设计了抗隐秘检测的隐秘算法,并基于微信公众平台实现了安全隐蔽通信方案.该方案能够满足秘密信息即时、安全、隐蔽的交换需求,具有很好的使用价值和应用前景.
-
-
常颖;
常大俊;
刁一凡
-
-
摘要:
随着数据量增加,单一存储模式下无法实现对海量数据信息存储,因此采用集群方式来实现海量数据进行有效存储,从而解决单一存储模式所带来的问题。但是,由于集群框架下每个DataNote节点由于其自身存储容量限制等问题,对数据进行分块来实现不同DataNode节点存储,提高了存储数据效率。当Client要访问集群框架下不同节点数据信息的时候,就要通过机架内或不同机架间进行数据传输,这样就会带来数据安全性问题。本文研究内容就是以Hadoop集群作为平台,对数据分块操作以及数据加密相关问题和算法进行研究,通过研究得到有效分块策略和加密算法改进,提高数据分块有效性和数据安全性。
-
-
莫遥;
梁铸;
吴波;
陈翔
- 《中国电子学会第二十四届信息论学术年会》
| 2017年
-
摘要:
P2P流量是近年来网络上较常见且难以识别的一种流量,本文针对这种流量提出了一种综合已有方法且结合报文首部统计特征分类与数据分块思想的新型高效识别方法.该方法通过统计报文首部ASCII码出现的频率,提取出一个256维的特征,使用决策树算法对流量进行分类识别.在识别的过程中,本文进一步提出数据分块的思想,获取更准确的统计特征,以提高识别的正确率.测试结果表明,该方法可以在多种流量混杂的情况下高效识别出P2P流量,且具有较高的准确度.
-
-
-
-
周可;
张江陵;
王芳
- 《2002年全国开放式分布与并行计算学术会议》
| 2002年
-
摘要:
网络磁盘阵列存储系统是一种新型的网络存储系统.它由文件服务器和网络磁盘阵列组成,具有命令与数据分流、容量与带宽同步扩展等特点.本文详细介绍了网络磁盘阵列存储系统的三种结构扩展方式——组内扩展、组间扩展和串内级联,并对系统扩展后的数据分块方式展开了讨论,得出系统内部数据分块方式的划分类型,指出不同数据分块方式的优点及其应用类型.
-
-
-
-
-
-