首页> 中文期刊>计算机应用 >逼真生成表格式数据的非时间属性关联模型

逼真生成表格式数据的非时间属性关联模型

     

摘要

To solve the difficulty of attribute correlation in the process of simulating table data,an H model was proposed for describing not-temporal attribute correlation in table data.Firstly,the key attributes of the evaluation subject and the evaluated subject were extracted from the data set,by the twofold frequency statistics,four relationships of the key attributes were obtained.Then,the Maximum Information Coefficient (MIC) of each relationship was calculated to evaluate the correlation of each relationship,and each relationship was fitted by the Stretched Exponential (SE) distribution.Finally,the data scales of the evaluation subject and the evaluated subject were set.According to the result of fitting,the activity of the evaluation subject was calculated,and the popularity of the evaluated subject was calculated.H model was obtained through the association that was established by equal sum of activity and popularity.The experimental results show that H model can effectively describe the correlation characteristics of the non-temporal attributes in real data sets.%针对数据仿真过程中表格数据属性间关联难的问题,提出一种刻画表格数据中非时间属性间关联特征的H模型.首先,从数据集中提取评价主体和被评价主体关键属性,进行两重频数统计,得到关于关键属性的4个关系对;然后,计算各关系对的最大信息系数(MIC)来评估各关系对的相关性,并采用拉伸指数分布(SE)对各关系对进行关系拟合;最后,设置评价主体和被评价主体的数据规模,根据拟合出的关系计算出评价主体的活跃度和被评价主体的流行度,通过活跃度总和等于流行度总和建立关联,得到非时间属性关联的H模型.实验结果表明,利用H模型能有效地刻画真实数据集中非时间属性间的关联特征.

著录项

  • 来源
    《计算机应用》|2017年第9期|2684-2688|共5页
  • 作者单位

    福建师范大学软件学院,福州350117;

    福建省公共服务大数据挖掘与应用工程研究中心,福州350117;

    福建师范大学软件学院,福州350117;

    福建省公共服务大数据挖掘与应用工程研究中心,福州350117;

    福建师范大学软件学院,福州350117;

    福建省公共服务大数据挖掘与应用工程研究中心,福州350117;

    福建师范大学软件学院,福州350117;

    福建省公共服务大数据挖掘与应用工程研究中心,福州350117;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计;
  • 关键词

    数据仿真; 关联; 最大信息系数; 拉伸指数分布; 属性关联;

  • 入库时间 2022-08-18 04:49:16

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号