首页> 中国专利> 一种蕴含相关性特征面向系统测试用的仿真流式大数据生成方法

一种蕴含相关性特征面向系统测试用的仿真流式大数据生成方法

摘要

本发明公开了一种蕴含相关性特征面向系统测试用的仿真流式大数据生成方法,解决了流式大数据系统测试中的仿真数据生成问题。本发明首先分析真实场景的种子数据集,给出两两属性散点图,再采用最大互信息系数描述两两属性间的相关性,生成一N个节点的带权无向完全图(N为数据属性个数,权值为计算出的相关系数),接着提出c‑prim算法划分属性组,使得分解出的属性组具有类似高内聚低耦合的特点,再给出一种时序模型选择策略,根据每个属性组的不同特点,采用不同的时序模型进行模拟,进而保证最终生成的数据在时序上的相关性,最后提出了双层滑动窗口的方法控制并行度和流数据输出速度。本发明能够生成与真实场景数据特征比较接近的流式大数据,同时能够简单有效地控制生成数据流流速。

著录项

  • 公开/公告号CN106294131A

    专利类型发明专利

  • 公开/公告日2017-01-04

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN201610612904.9

  • 发明设计人 江国华;曹旭峰;周明泉;

    申请日2016-07-26

  • 分类号G06F11/36;

  • 代理机构

  • 代理人

  • 地址 211106 江苏省南京市江宁区将军大道29号

  • 入库时间 2023-06-19 01:14:33

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-17

    发明专利申请公布后的视为撤回 IPC(主分类):G06F11/36 申请公布日:20170104 申请日:20160726

    发明专利申请公布后的视为撤回

  • 2017-02-01

    实质审查的生效 IPC(主分类):G06F11/36 申请日:20160726

    实质审查的生效

  • 2017-01-04

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号