您现在的位置: 首页> 研究主题> 流数据

流数据

流数据的相关文献在2000年到2023年内共计808篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、铁路运输 等领域,其中期刊论文198篇、会议论文12篇、专利文献651991篇;相关期刊114种,包括数字技术与应用、电脑知识与技术、计算机工程等; 相关会议10种,包括第33届中国数据库学术会议(NDBC2016 )、CCF2014-2015中国计算机科学技术发展报告会、第五届全国可信计算学术会议等;流数据的相关文献由1705位作者贡献,包括殷宇辉、杨贤文、严国涛等。

流数据—发文量

期刊论文>

论文:198 占比:0.03%

会议论文>

论文:12 占比:0.00%

专利文献>

论文:651991 占比:99.97%

总计:652201篇

流数据—发文趋势图

流数据

-研究学者

  • 殷宇辉
  • 杨贤文
  • 严国涛
  • 刘佳
  • 董文新
  • 吕纪竹
  • 闵革勇
  • 陈星
  • 魏晓辉
  • 刘泽民
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 朱维富; 曾智霞; 肖如良
    • 摘要: 5G通讯技术的迅猛发展使工业物联网得到了全面提升,工业物联网数据规模将越来越大、数据维度也越来越高,如何高效利用流聚类进行工业物联网数据挖掘工作是一个亟需解决的问题.提出了一种基于工业物联网数据流自适应聚类方法.该算法利用微簇之间的高密性,计算各微簇节点的局部密度峰值以自适应产生宏簇数;采用引力能量函数对微集群进行递归在线更新;并且去除边缘相交微簇之间的计算以达到降低维护宏簇所需的计算量.理论分析和实验对比表明所提出的方法跟当前主流的流聚类算法相比有着更高质量的聚类效果.
    • 张笑燕; 刘志浩; 杜晓峰; 陆天波
    • 摘要: 针对现代数据仓库系统中常见的需接收大量流数据,且其与磁盘上已有的数据做连接后再入库的场景进行了探讨。通过合理设置磁盘分页和应用缓存模块,分散磁盘I/O压力,在已有研究的基础上提出了一种具有更高效率的数据接收方案,并引入一致性哈希函数将其扩展到分布式环境,提出一种应用于分布式环境的D-CACHEJOIN算法。通过理论计算算法的成本模型,并使用服从Zipfian分布的数据进行模拟实验。实验结果表明,在接近现实的实际应用场景下,所提算法拥有比现有算法更高的效率,同时能够快速方便地扩展到分布式环境。
    • 谭松鹤; 覃琪
    • 摘要: 当前,无线传感器网络在社会生产、生活领域得到了广泛的应用,展现出了广阔的应用前景。在网络技术处于高速发展的时代背景下,无线传感器网络终端设备呈现出了多元化、智能化的特征,多流数据多宿主传输则成为了5G网络下无线传感器网络数据传输机制研究中的重要内容。
    • 摘要: 通过铺设人脸识别、人流监控镜头,实现对商圈人流数据的获取、统计与监控,开发商圈数据统计分析、线上服务中心等子应用,不断提升商圈智慧化管理水平。
    • 李恒春; 樊伟麟; 孟宁; 兰秋军
    • 摘要: 直方图是一种被广为应用的统计数据发布形式,其潜在的隐私泄露风险是当前数据隐私保护领域的关注点.该文针对流数据的直方图发布问题,提出一种符合差分隐私保护要求的方法.其主要特点包括:(1)将w-事件引入流数据的直方图发布加噪机制以确保其满足差分隐私保护需求;(2)采用卡尔曼滤波方式对加噪后的流数据进行后置处理以改善数据效用;(3)通过指数平滑法改进卡尔曼滤波方式避免相邻数据之间的突变性.论文以UCI的两个真实数据集为基础进行流数据直方图模拟发布实验,结果表明该文方法在不同差分隐私预算约束、不同窗口大小情形下均具有明显优势,可在相同隐私保护水平下获得更高的数据可用性.
    • 莫晓楠
    • 摘要: 随着信息时代化的快速发展,进一步扩大了大数据的规模。目前情况来看,对流数据管理与科学化处理是云基础是主要应用于的方面。此外,云计算环境中运用的各种资源都以服务作为主要使用模式,纵观传统流数据系统的发展,由于受到快速发展时代的影响,进而使得数据的各种多元性结构表现出极高的复杂性。因此,传统模式对于解决发展过程中存在的问题较为困难,但云计算技术可以提高流数据服务的品质,因此云计算已成为未来发展的基石。本文在接下来的部分,将会主要对云计算下背景下流数据集成和服务展开详细分析。
    • 王鹏
    • 摘要: 随着网络数据结构的快速应用,对网络包中试飞数据的完整性越来越重视,研究网络包中试飞数据缺失值填充方法。在卸载分流数据完成后对网络包数据预处理后的物理量进行填充,首先根据网络包中试飞数据参数的类型特点,利用心跳字来查找缺失值所在的时间点;然后对不同类型的参数采取不同的填充方法,对于int16类型、Uint16类型和float类型的参数利用基于统计的处理方法来进行缺失值填充,对于bool型或者byte型的参数,先判断缺失值时间点的前后数值是否相同,若不相同,则分别使用基于相关性系数分类的聚类处理方法和基于极限学习机的分类方法来进行缺失值填充;最后提出了两个网络包中试飞数据缺失值填充算法,并对其分析对比。
    • 郭虎升; 任巧燕; 王文剑
    • 摘要: 流数据作为一种新型数据,在各个领域均有应用,其快速、大量及持续不断的特点使得单遍精准扫描成为在线学习算法的必备特质.在流数据不断产生过程中,往往会发生概念漂移,目前对于概念漂移节点检测的研究相对成熟,然而实际问题中学习环境因素朝不同方向发展往往会导致流数据中概念漂移类别的多样性,这给流数据挖掘及在线学习带来了新的挑战.针对这个问题,提出一种基于时序窗口的概念漂移类别检测(concept drift class detection based on time window,CD-TW)方法.该方法借助栈和队列对流数据进行存取,借助窗口机制对流数据进行分块学习.首先创建2个分别加载历史数据和当前数据的基础节点时序窗口,通过比较二者所包含数据的分布变化情况来检测概念漂移节点.然后创建加载漂移节点后部分数据的跨度时序窗口,通过分析该窗口中数据分布的稳定性检测漂移跨度,进而判断概念漂移类别.实验结果表明该方法不仅能够精确定位概念漂移节点,同时在漂移类别判断方面也表现出良好性能.
    • 付博扬; 严寒冰
    • 摘要: 网络攻击尤其是APT攻击普遍使用被攻陷设备作为跳板,利用下级被控设备执行攻击行为,攻击者身份则隐藏于网络之中.以Mirai为首的僵尸网络通常采用C&C服务器控制受感染的机器人,机器人之间常常存在多级控制关系,因此单个节点的异常检测往往难以解决问题.提出一种僵尸网络多级控制关系可视化分析系统,主要通过流特征筛选控制节点,梳理控制行为,通过图数据库将关系数据导出实现可视化,从而直观发现节点间的多级控制关系,找出跳板节点,从而溯源僵尸网络,找出隐藏的主机节点.
    • 郭虎升; 高淑花; 王文剑
    • 摘要: 概念漂移处理大多采用集成学习策略,然而这些方法多数不能及时提取漂移发生后新分布数据的关键信息,导致模型性能较差。针对这个问题,本文提出一种基于串行交叉混合集成的概念漂移检测及收敛方法(Concept drift detection and convergence method based on hybrid ensemble of serial and cross,SC_ensemble)。在流数据处于平稳状态下,该方法通过构建串行基分类器进行集成,以提取代表数据整体分布的有效信息。概念漂移发生后,在漂移节点附近构建并行的交叉基分类器进行集成,提取代表最新分布数据的局部有效信息。通过串行基分类器和交叉基分类器的混合集成,该方法兼顾了流数据包含的整体分布信息,又强化了概念漂移发生时的重要局部信息,使集成模型中包含了较多“好而不同”的基学习器,实现了漂移发生后学习模型的高效融合。实验结果表明,该方法可使在线学习模型在漂移发生后快速收敛,提高了模型的泛化性能。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号