首页> 外文期刊>電子情報通信学会論文誌 >重複部分木情報を利用した事前圧縮を特徴とするSerDeの開発と評価
【24h】

重複部分木情報を利用した事前圧縮を特徴とするSerDeの開発と評価

机译:使用重叠子树信息进行预压缩的SerDe的开发和评估

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

ビッグデータを扱うシステムでは,ストレージ資源の節約やI/O負荷の低減のために,Serial-izer/Deserializer(以下,"SerDe")が利用される.従来のSerDeは,木構造データをバイト配列へ直列化し,更に既存圧縮技術を適用してデータサイズを縮小する.しかし既存圧縮技術では,大きな部分木単位で重複がある場合や重複した部分木どうしが離れている場合に,その冗長性を十分に利用した圧縮を行えない.そこで我々は,部分木どうしの等値性や重複した部分木の出現回数などの情報を利用した事前圧縮を行うSerDeを開発した.重複した部分木を含む木構造データを扱う場合,従来のSerDeと既存圧縮技術の組合せよりも性能上の優位性を示すことを,その評価結果とともに述べる.
机译:在处理大数据的系统中,串行化器/反序列化器(以下称为“ SerDe”)用于节省存储资源并减少I / O负载。通过使用现有压缩技术将数据序列化为较小的大小,可以减小数据大小。我们无法进行全面的压缩,因此,我们开发了SerDe,它使用子树的相等性和重复的子树的出现次数等信息执行预压缩。在处理结构化数据的情况下,我们将证明它具有优于常规SerDe和现有压缩技术以及评估结果相结合的性能优势。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号