基于分布式数据流的大数据分类模型和算法

毛国君; 胡殿军; 谢松燕

首页> 中文期刊>计算机学报 >基于分布式数据流的大数据分类模型和算法

基于分布式数据流的大数据分类模型和算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

大数据是需求驱动的概念.随着数据库系统的普及和因特网服务的扩张,企业或者个人可用的数据正在膨胀,已有的技术很难满足大数据时代的数据分析需求,因此需要探索新的理论和方法来支撑大数据的应用.虽然大数据的4V属性已经被广泛讨论,但是它们大多描述的仍然是大数据的表象,所以很难从中抽象出统一的数据格式,因而进一步寻找可用于数据格式化的技术特征是必要的.面向于以分布式和流动性为主要技术特征的大数据应用需求,文中以分布式数据流为数据表达载体,在此基础上设计对应的大数据分类模型和挖掘算子.同时针对大数据的分类挖掘需要解决的关键问题来构建关键步骤对应的算法.理论上证明了文中给出的微簇合并技术和样本数据重构方法的合理性.实验表明:文中提出的基于分布式数据流的大数据的分类模型及算法不仅能大幅度地减少网络节点间的通讯代价,而且可以获得平均10%左右的全局挖掘精度的提升(对比已有的典型算法DS-means);虽然时间花费略高于DS-means,但是两者在不同的数据容量测试下相差很小、且时间攀升趋势相当.

著录项

来源
《计算机学报》|2017年第1期|161-175|共15页
作者
毛国君; 胡殿军; 谢松燕;
展开▼
作者单位

中央财经大学信息学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类专家系统、知识工程;
关键词
大数据; 数据挖掘; 分布式数据流; 微簇; 集成分类;
入库时间 2022-08-21 00:25:43

相似文献

中文文献
外文文献
专利

1. 基于分布式数据流的大数据分类算法 [J] . 李恒波1 . 饮食科学 . 2019,第004期
2. 基于拉普拉斯回归主动学习的大数据流分类算法 [J] . 杜恒 ,杨俊成 . 计算机应用与软件 . 2019,第012期
3. 基于数据概要描述的分布式数据流聚类模型与算法 [J] . 毛国君 ,曹永存 . 计算机科学 . 2013,第006期
4. 基于图模型的数据流分类算法 [J] . 孙艳歌 ,陈旭生 ,邵罕 . 信阳师范学院学报：自然科学版 . 2020,第4期
5. 基于概念漂移检测算法的数据流分类模型 [J] . 孙娜 . 计算机工程与设计 . 2013,第009期
6. 无线传感器网络中基于模式序列分类的分布式数据流过滤技术 [C] . 石冰 ,杨晓春 ,王斌 . 第二十三届中国数据库学术会议（NDBC2006） . 2006
7. 基于分布式大数据流分类的电网设备风险辨识模型研究 [A] . 王磊 . 2019

基于分布式数据流的大数据分类模型和算法

摘要

著录项

相似文献

相关主题

期刊订阅