首页> 中文期刊>东南大学学报(自然科学版) >基于主成分分析及匹配聚类分析的数据表语义压缩方法

基于主成分分析及匹配聚类分析的数据表语义压缩方法

     

摘要

提出一种基于主成分分析及匹配聚类分析的数据表语义压缩方法PCA-Clustering.主成分分析利用属性间相关性,提取主成分以实现纵向压缩;匹配聚类通过对匹配程度的量度决定元组的隶属,用较少的簇集代表元组代替所有元组以实现横向压缩,并充分利用较小的允许误差取得更好的压缩比.仿真实验结果表明,在数据属性间线性相关关系明显的情况下,PCA-Clustering在压缩比方面平均优于Fascicles和ItCompress 10%~15%左右;与采用CaRT模型的SPARTAN相比,由于CaRT对于线性相关明显的数值型属性效果不够理想,PCA-Clustering仍然具有较好的压缩比.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号