流数据
流数据的相关文献在2000年到2023年内共计808篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、铁路运输
等领域,其中期刊论文198篇、会议论文12篇、专利文献651991篇;相关期刊114种,包括数字技术与应用、电脑知识与技术、计算机工程等;
相关会议10种,包括第33届中国数据库学术会议(NDBC2016 )、CCF2014-2015中国计算机科学技术发展报告会、第五届全国可信计算学术会议等;流数据的相关文献由1705位作者贡献,包括殷宇辉、杨贤文、严国涛等。
流数据—发文量
专利文献>
论文:651991篇
占比:99.97%
总计:652201篇
流数据
-研究学者
- 殷宇辉
- 杨贤文
- 严国涛
- 刘佳
- 董文新
- 吕纪竹
- 闵革勇
- 陈星
- 魏晓辉
- 刘泽民
- 吴明晖
- 应晶
- 张明
- 林兵
- 王兴旺
- 王艳辉
- 白禹铉
- 金苍宏
- 黄滔
- C·兰森
- C·蒂尔
- D·J·克纳普
- D·麦克艾利斯特
- F·W·菲利普斯
- H·C·霍
- P·海克
- R·P·穆勒
- R·克洛斯
- 刘云生
- 刘伟
- 刘国华
- 刘圆圆
- 刘树新
- 刘立峰
- 卢宇
- 吕红蕾
- 吴翔
- 宫崎秋弘
- 廖湖声
- 张平
- 徐海啸
- 曹鹏飞
- 李亮雄
- 李勇
- 杨鹏飞
- 段翰聪
- 比尼塔·古普塔
- 渊上美智子
- 王宣明
- 王麟东
-
-
朱维富;
曾智霞;
肖如良
-
-
摘要:
5G通讯技术的迅猛发展使工业物联网得到了全面提升,工业物联网数据规模将越来越大、数据维度也越来越高,如何高效利用流聚类进行工业物联网数据挖掘工作是一个亟需解决的问题.提出了一种基于工业物联网数据流自适应聚类方法.该算法利用微簇之间的高密性,计算各微簇节点的局部密度峰值以自适应产生宏簇数;采用引力能量函数对微集群进行递归在线更新;并且去除边缘相交微簇之间的计算以达到降低维护宏簇所需的计算量.理论分析和实验对比表明所提出的方法跟当前主流的流聚类算法相比有着更高质量的聚类效果.
-
-
张笑燕;
刘志浩;
杜晓峰;
陆天波
-
-
摘要:
针对现代数据仓库系统中常见的需接收大量流数据,且其与磁盘上已有的数据做连接后再入库的场景进行了探讨。通过合理设置磁盘分页和应用缓存模块,分散磁盘I/O压力,在已有研究的基础上提出了一种具有更高效率的数据接收方案,并引入一致性哈希函数将其扩展到分布式环境,提出一种应用于分布式环境的D-CACHEJOIN算法。通过理论计算算法的成本模型,并使用服从Zipfian分布的数据进行模拟实验。实验结果表明,在接近现实的实际应用场景下,所提算法拥有比现有算法更高的效率,同时能够快速方便地扩展到分布式环境。
-
-
谭松鹤;
覃琪
-
-
摘要:
当前,无线传感器网络在社会生产、生活领域得到了广泛的应用,展现出了广阔的应用前景。在网络技术处于高速发展的时代背景下,无线传感器网络终端设备呈现出了多元化、智能化的特征,多流数据多宿主传输则成为了5G网络下无线传感器网络数据传输机制研究中的重要内容。
-
-
-
李恒春;
樊伟麟;
孟宁;
兰秋军
-
-
摘要:
直方图是一种被广为应用的统计数据发布形式,其潜在的隐私泄露风险是当前数据隐私保护领域的关注点.该文针对流数据的直方图发布问题,提出一种符合差分隐私保护要求的方法.其主要特点包括:(1)将w-事件引入流数据的直方图发布加噪机制以确保其满足差分隐私保护需求;(2)采用卡尔曼滤波方式对加噪后的流数据进行后置处理以改善数据效用;(3)通过指数平滑法改进卡尔曼滤波方式避免相邻数据之间的突变性.论文以UCI的两个真实数据集为基础进行流数据直方图模拟发布实验,结果表明该文方法在不同差分隐私预算约束、不同窗口大小情形下均具有明显优势,可在相同隐私保护水平下获得更高的数据可用性.
-
-
莫晓楠
-
-
摘要:
随着信息时代化的快速发展,进一步扩大了大数据的规模。目前情况来看,对流数据管理与科学化处理是云基础是主要应用于的方面。此外,云计算环境中运用的各种资源都以服务作为主要使用模式,纵观传统流数据系统的发展,由于受到快速发展时代的影响,进而使得数据的各种多元性结构表现出极高的复杂性。因此,传统模式对于解决发展过程中存在的问题较为困难,但云计算技术可以提高流数据服务的品质,因此云计算已成为未来发展的基石。本文在接下来的部分,将会主要对云计算下背景下流数据集成和服务展开详细分析。
-
-
王鹏
-
-
摘要:
随着网络数据结构的快速应用,对网络包中试飞数据的完整性越来越重视,研究网络包中试飞数据缺失值填充方法。在卸载分流数据完成后对网络包数据预处理后的物理量进行填充,首先根据网络包中试飞数据参数的类型特点,利用心跳字来查找缺失值所在的时间点;然后对不同类型的参数采取不同的填充方法,对于int16类型、Uint16类型和float类型的参数利用基于统计的处理方法来进行缺失值填充,对于bool型或者byte型的参数,先判断缺失值时间点的前后数值是否相同,若不相同,则分别使用基于相关性系数分类的聚类处理方法和基于极限学习机的分类方法来进行缺失值填充;最后提出了两个网络包中试飞数据缺失值填充算法,并对其分析对比。
-
-
郭虎升;
任巧燕;
王文剑
-
-
摘要:
流数据作为一种新型数据,在各个领域均有应用,其快速、大量及持续不断的特点使得单遍精准扫描成为在线学习算法的必备特质.在流数据不断产生过程中,往往会发生概念漂移,目前对于概念漂移节点检测的研究相对成熟,然而实际问题中学习环境因素朝不同方向发展往往会导致流数据中概念漂移类别的多样性,这给流数据挖掘及在线学习带来了新的挑战.针对这个问题,提出一种基于时序窗口的概念漂移类别检测(concept drift class detection based on time window,CD-TW)方法.该方法借助栈和队列对流数据进行存取,借助窗口机制对流数据进行分块学习.首先创建2个分别加载历史数据和当前数据的基础节点时序窗口,通过比较二者所包含数据的分布变化情况来检测概念漂移节点.然后创建加载漂移节点后部分数据的跨度时序窗口,通过分析该窗口中数据分布的稳定性检测漂移跨度,进而判断概念漂移类别.实验结果表明该方法不仅能够精确定位概念漂移节点,同时在漂移类别判断方面也表现出良好性能.
-
-
付博扬;
严寒冰
-
-
摘要:
网络攻击尤其是APT攻击普遍使用被攻陷设备作为跳板,利用下级被控设备执行攻击行为,攻击者身份则隐藏于网络之中.以Mirai为首的僵尸网络通常采用C&C服务器控制受感染的机器人,机器人之间常常存在多级控制关系,因此单个节点的异常检测往往难以解决问题.提出一种僵尸网络多级控制关系可视化分析系统,主要通过流特征筛选控制节点,梳理控制行为,通过图数据库将关系数据导出实现可视化,从而直观发现节点间的多级控制关系,找出跳板节点,从而溯源僵尸网络,找出隐藏的主机节点.
-
-
郭虎升;
高淑花;
王文剑
-
-
摘要:
概念漂移处理大多采用集成学习策略,然而这些方法多数不能及时提取漂移发生后新分布数据的关键信息,导致模型性能较差。针对这个问题,本文提出一种基于串行交叉混合集成的概念漂移检测及收敛方法(Concept drift detection and convergence method based on hybrid ensemble of serial and cross,SC_ensemble)。在流数据处于平稳状态下,该方法通过构建串行基分类器进行集成,以提取代表数据整体分布的有效信息。概念漂移发生后,在漂移节点附近构建并行的交叉基分类器进行集成,提取代表最新分布数据的局部有效信息。通过串行基分类器和交叉基分类器的混合集成,该方法兼顾了流数据包含的整体分布信息,又强化了概念漂移发生时的重要局部信息,使集成模型中包含了较多“好而不同”的基学习器,实现了漂移发生后学习模型的高效融合。实验结果表明,该方法可使在线学习模型在漂移发生后快速收敛,提高了模型的泛化性能。
-
-
- 《第33届中国数据库学术会议(NDBC2016 )》
| 2016年
-
摘要:
与传统结构化数据去重计数算法相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.为了适应大数据环境下流数据去重计数的要求,必须对概率估计HyperLogLog算法进行改进,提出基于Storm平台的混合滑动窗口HyperLogLog并行化算法.算法在满足Storm流处理平台要求基础上,通过滑动窗口机制和并行化处理,为提高算法的灵活性和通用性,支持基于元组和时间两种滑动窗口方式.最后通过实验验证该算法的误差和内存开销,结果表明在原有算法标准误差不变的情况下,改进算法比传统HyperLogLog算法具有更小的内存消耗和更高的处理效率.
-
-
-
Zhiguo Ding;
丁智国
- 《第五届全国可信计算学术会议》
| 2015年
-
摘要:
流数据的海量、无限、分布动态变化且不均衡等特征使得对流数据的在线异常检测成为当前的一个研究热点.本文在分析异常数据的少而不同且更容易通过随机空间的分割而孤立出来的特征,基于在线集成学习理论,提出了一种基于隔离森林的在线流数据异常检测算法.在4个UCI标准数据集上的实验结果表明所提出的方法有效.但该算法中的一些关键参数,如窗口尺寸、集成规模等参数的设置,需要进一步研究以提高算法的性能。其次,在构建隔离树时,属性及其属性值的随机选择没有考虑样本属性值的分布情况,对此也将进一步展开研究。
-
-
-
孔淑慧;
姚家奕;
马兰云
- 《第13届海峡两岸信息管理发展与策略学术研讨会》
| 2007年
-
摘要:
随着计算机网络飞速发展,出现了快速的、随时间变化的、大量甚至无限的流数据,它的出现给适用于静态数据的数据库技术和数据挖掘技术带来了新的挑战。对于流数据的异常挖掘,本文选择了基于偏差检测的OLAP数据立方技术,提出了该方法的一个新的应用领域:智能手机的入侵检测,并设计了一个基于多代理和流数据异常挖掘技术的智能手机入侵检测的初步模型。
-
-
姚春芬;
陈红
- 《第二十三届中国数据库学术会议(NDBC2006)》
| 2006年
-
摘要:
数据流具有快速、大量、连续、随时间变化等特性,使得流数据无法完整地保存在存储介质中.而复杂的聚集计算需要对数据进行多趟扫描来获得精确查询结果,这在数据流的处理上造成了很大的困难.因此在用户接受范围内,使用一趟算法获得一个近似的聚集结果的技术就成为了研究热点.直方图在数据流处理中通常用于保存大纲数据结构.目前许多数据流管理原型系统中多采用直方图、小波变换、数据写生、随机抽样等方法来保存大纲数据. 直方图结构在数据流聚集处理中用于保存大纲数据结构,但是用传统直方图进行聚集计算误差较大,尤其是当数据分布严重偏斜时更为明显.本文针对分布偏斜情况,给出了两种数据集中模型,并针对这两种模型提出了桶内集中直方图聚集算法.该算法可以动态调整每个桶中数据集中区的边界,真实反映了数据集中情况,从而提高聚集查询精度.在以后的工作中,我们希望能将这个算法应用到复杂的相关聚集查询,并实现多个查询的资源共享。
-
-
Ni Sailong;
倪赛龙;
Wang Yongli;
王永利;
Zhao Zhongwen;
赵忠文;
Dong Zhenjiang;
董振江
- 《第33届中国数据库学术会议(NDBC2016 )》
| 2016年
-
摘要:
流数据相对于传统的静态数据,由于其无限性和动态性,是数据挖掘领域一个研究热点,近似查询技术在海量数据流实时分析领域得到了越来越多的认可,并且得到了广泛的应用.提出了一种综合流式处理和批处理的近似查询模型,利用滑动窗口提供流式近似查询能力,利用改进的分层抽样算法对于数据流产生的海量历史数据,进行分层抽样,最大限度避免偏倚值对于查询结果的影响.实验表明,提出的算法结合了滑动窗口流式分析以及分层抽样技术批处理分析的优点,提高了查询的精度.
-
-
数据库专委会
- 《CCF2014-2015中国计算机科学技术发展报告会》
| 2015年
-
摘要:
随着大数据时代的到来,以关系型数据库为代表的传统数据管理技术受到了严峻的挑战.针对大数据的应用特点,产生了一批具有代表性的新型数据管理系统.本文介绍了当前新型数据管理系统的主要架构,总结了典型的图数据、流数据、在线数据分析、众包数据、商业数据管理系统,对国内外研究现状进行了对比,并对未来的发展趋势进行了预测.
-
-
-
段磊;
唐常杰;
杨宁;
左劼;
王悦;
郑皎凌;
徐开阔
- 《第28届中国数据库学术会议》
| 2011年
-
摘要:
干预规则挖掘是近年从干预实践中提出的新型数据挖掘任务,旨在利用数据挖掘技术探测干预事件,发现最佳干预时机和力度,提供促进事物向期待状态转化的决策支持。文中以四年的研究实践为背景,介绍干预规则挖掘的研究沿革和现状,给出了干预规则挖掘的任务分类。从三个角度,即干预效果预测、干预方法发现和未知干预探测三方面,介绍干预规则挖掘的研究问题、困难和成果,展望了干预规则挖掘未来研究方向。
-
-
-
-
-
- 西门子公司
- 公开公告日期:1999-12-01
-
摘要:
在复用组合各数据流(DS)时将各数据流组合成各数字中间数据流(ZDS)。组合如此进行,使得各同类数据流(DS)共同组合成一个中间数据流(ZDS),而各不同类数据流(DS)组合入各不同的中间数据流(ZDS)中。对于这些中间数据流(ZDS)实施用于此中间数据流(ZDS)的差错识别和/或差错纠正的各种措施,最后将这些中间数据流(ZDS)组合成总数据流(GDS)。
-
-
-
-
-
-