您现在的位置: 首页> 研究主题> 列存储

列存储

列存储的相关文献在2004年到2022年内共计135篇,主要集中在自动化技术、计算机技术 等领域,其中期刊论文57篇、会议论文5篇、专利文献671061篇;相关期刊33种,包括信息系统工程、中小企业管理与科技、中国管理信息化等; 相关会议4种,包括第28届中国数据库学术会议、第27届中国数据库学术会议、第二十五届中国数据库学术会议(NDBC2008)等;列存储的相关文献由254位作者贡献,包括王梅、乐嘉锦、周智伟等。

列存储—发文量

期刊论文>

论文:57 占比:0.01%

会议论文>

论文:5 占比:0.00%

专利文献>

论文:671061 占比:99.99%

总计:671123篇

列存储—发文趋势图

列存储

-研究学者

  • 王梅
  • 乐嘉锦
  • 周智伟
  • 王攀
  • 郭琰
  • 夏小玲
  • 刘国华
  • 孙莉
  • C.B.宋
  • C.程
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 范三龙; 秦成虎
    • 摘要: 在互联网+创新背景下,用信息化技术的成果改造和提升传统的自动化设备,具有重要的前景.NoSQL数据库泛指非关系型数据库,是大数据时代的热点.该文在NoSQL数据库技术基础上,设计实现了一种适合在嵌入式装置中运行的实时数据库.从数据对象的描述,对象的存储和索引,对象的查找、遍历、增删改操作,消息总线中通知的注册和发送四个方面,介绍了数据库的组成,内存的使用,双哈希索引的构成,命令及消息传递机制等.该实时数据库可以完成数据对象的灵活定义和高效访问,进而实现各种自动化功能.
    • 邱宏
    • 摘要: 随着物联网及云计算技术的兴起,以及移动互联网技术的不断发展,以社交网络、电商等为代表的新型应用在日常生活中使用越来越广,与此同时它们的数据规模也急剧增加。列存储数据库在管理海量数据、从规模庞大的数据中获取有用信息方面有突出的优势。在处理海量数据时列存储数据库的性能要明显优于传统的行存储数据库,因此研究基于大数据的列存储数据库技术有重要意义。
    • 孙靖超; 芦天亮
    • 摘要: 为解决现有列存储数据库压缩策略在压缩过程中遇到的数据离散程度大、分类粒度小、配套分类算法缺陷导致的学习成本高、压缩效率难以保证的问题,提出了一种基于排序的列区混合压缩策略.首先根据HBase特点设计了一种对各列数据进行排序的方法加强数据紧密度,然后根据数据特点分别使用混级区压缩策略和混级列压缩策略进行压缩策略推荐,在TPC-DS标准数据集上与前人策略进行比较.实验结果显示,该方法在压缩率、压缩/解压时间方面均有优异的表现,从而证明了其有效性.
    • 张滨; 乐嘉锦
    • 摘要: The characters of big data are volume,variety,value,velocity,and common hardware and open source.Aiming at the system inefficiency and limited scalability of traditional relational database in big data analysis,this paper presen-ted an algorithm of Hash joins in MapReduce distributed environment based on column-store by introducing MapReduce computing model.First of all,this paper proposed the design of large data-oriented distributed computing models.Then, it proposed the partition aggregation and the heuristic optimization strategy to realize the implementation of Hash join algorithm.Lastly,the experiments evaluated execution time and load capacity.The results show that the proposed method is effective and can provid good scalability in big data analysis.%大数据具有规模大、深度大、宽度大、处理时间短、硬件系统普通化、软件系统开源化的特点.传统关系型数据库在对大数据进行操作时存在系统性能严重下降、计算效率提升有限以及可扩展性差等问题,因此引入 MapRe-duce并行计算模型,提出一种大数据上基于列存储的 MapReduce 分布式 Hash 连接算法.首先,设计面向大数据的分布式计算模型,在设计的分片聚集并行连接的基础上,利用 Hash连接以及动态探测方法优化了数据并行连接处理效率;然后,针对该算法开发了基于 Hadoop的原型系统.通过实验证明,在大数据分析处理中,所提算法在执行时间和负载能力上都有很好的性能表现,也能提供良好的可扩展性.
    • 俞文谦; 胡爽; 胡卉芪
    • 摘要: 随着数据规模和分析需求的日益增长,数据库面向联机分析处理(On-Line Analytical Processing,OLAP)应用的查询性能变得愈发重要.Cedar是一款基于读写分离架构的分布式关系数据库,由于它主要面向联机事务处理(On-Line Transaction Processing,OLTP)业务,在面对分析处理负载时性能表现不足.对于这个问题,很多研究表明列存储技术能够有效地提高I/O (Input/Output)效率,进而提升分析处理的性能.在Cedar上提出了一种列存储机制,分析了其适用场景并针对这种机制改进了Cedar的数据扫描和批量更新方法.实验结果表明,该机制能大幅度地提升Cedar分析处理性能,并且对事务处理性能的影响控制在10%以内.
    • 摘要: 信息技术的发展使大数据技术在社会各领域得到广泛应用,极大程度上提升社会生产效率和质量.基于此,论文就基于列存储的大数据分析系统物化策略进行研究,首先就大数据分析系统中的列存储技术、MapReduce模型和物化技术进行简要概述,然后结合当前大数据理念的发展现状,从早期物化策略、延迟物化策略和混合物化策略几方面阐述列存储下大数据分析系统的物化策略.
    • 丁祥武; 陈金鑫; 王梅
    • 摘要: GPU and integrated CPU-GPU architecture has powerful parallel processing capability and programmable pipeline, which gradually becomes a hot area of database researches. In order to fully explore the parallel abilities of het-erogeneous platform, enhance the performance of the column-storage database query, in this paper, it takes full account of differences of system architecture based on heterogeneous platforms, firstly proposes the improved multidimensional data classification method of data partition strategy ICMD based on improving the multi-dimensional data partitioning method (CMD), using stream processor to process sub-space join operation in parallel. Secondly, through the implementation of query dynamic load using task allocation model evaluation, it makes the query execution in parallel between multi-core CPU, GPU and other accelerator components. At the same time, it uses on-chip global synchronization and efficient imple-mentation, local memory reuse optimization ICMD connection algorithm. Using SSB benchmark test, the experimental re-sults show that based on the platform of Intel HD Graphics 4600, ICMD connection query receives 1.35 speedup com-pared to the CPU version and receives 18%performance improvement compared with Ocelot of GPU query engine.%GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点.为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进行连接的数据划分策略——ICMD(Improved CMD),利用GPU流处理器并行处理各个子空间上的连接,然后利用任务评估分配模型实现查询负载的动态分配,使得查询操作能在多核CPU、GPU上高效并行执行.同时利用片上全局同步机制、局部内存重用技术优化ICMD连接算法.最后采用SSB基准测试集测试,结果表明:Intel?HD Graphics 4600平台上并行连接查询相比于CPU版本获得了35%的性能提升,较GPU查询引擎的Ocelot性能上提升了18%.
    • 徐晓锦; 孙蕾
    • 摘要: 通过对分布式列存储机制下多维数据仓库模型的研究,考虑到多维数据仓库模型上的关联和聚集操作常常会引入大量的数据迁移,提出一种有效的列存储机制下多维数据仓库模型的优化方法即结合层次编码技术.采用维表层次全局域编码和维表层次局部域编码相结合的方式对传统星型模型维表中的层次信息进行二进制编码整合,将维表的层次信息压缩进事实表形成无连接星型模型,并针对新模型下的数据特征提出一种复合压缩策略,以期减少分布式列存储机制下的OLAP操作引入的数据迁移并降低数据存储空间,提升系统的查询性能.实验结果表明,该优化方法是可行且有效的.%Based on the research of multi dimension data warehouse model on the distributed column storage,an effective distributed column storage optimization method with hierarchical coding techniques is proposed,considering that the association and aggregation operation of multi dimension data warehouse model often bring a lot of data migration.The optimization method uses local dimension hierarchical encoding and global dimension hierarchical encoding to encode the level information of the dimension table,and then compresses dimension hierarchies' information into fact table to form a join-free star schema.Then,a composite compression strategy is put forward for the data feature of the new model to reduce the data migration introduced by OLAP operation and the data storage space under the distributed column storage mechanism,improving the query performance of the system.The experimental results show that this optimization method is feasible and effective.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号