数据预处理
数据预处理的相关文献在1984年到2022年内共计1949篇,主要集中在自动化技术、计算机技术、测绘学、无线电电子学、电信技术
等领域,其中期刊论文1585篇、会议论文224篇、专利文献1526521篇;相关期刊816种,包括现代电子技术、电脑知识与技术、计算机工程等;
相关会议208种,包括2014年中国地球科学联合学术年会、中国电力规划设计协会勘测分会电力工程测量专业经验交流会、第二十二届中国过程控制会议等;数据预处理的相关文献由4912位作者贡献,包括方元康、李超锋、王伟等。
数据预处理—发文量
专利文献>
论文:1526521篇
占比:99.88%
总计:1528330篇
数据预处理
-研究学者
- 方元康
- 李超锋
- 王伟
- 王军
- 王鹏
- 胡学钢
- 于戈
- 刘涛
- 夏启寿
- 彭泽军
- 李刚
- 李静
- 杨春霞
- 王宝瑞
- 陈辉
- 刘伟
- 刘忠
- 刘自伟
- 周俊
- 孔静
- 宋彦坡
- 宋晓宇
- 张伟
- 张增敏
- 张帆
- 张楠
- 彭小奇
- 曹亮
- 朱志国
- 李建华
- 李斌
- 李明
- 李龙飞
- 杨斌
- 杨炳儒
- 杨超
- 滕少华
- 谢嘉
- 邱泽阳
- 陈健
- 陈浩
- 陈铁梅
- 黄威
- 万柏坤
- 刘博
- 刘宝旭
- 刘新华
- 刘杰
- 刘毅
- 刘洋
-
-
滕雷;
魏长寿;
王俊杰;
王仁锋
-
-
摘要:
为提高沉降预测精度,掌握沉降发展趋势,本文建立动态Verhulst模型对高层建筑进行沉降预测。首先,对原始数据进行数据预处理,实现原始数据等时距化,解决非等时距数据无法建模的客观难题;其次,采用“去旧加新”的思想,及时更新数据,对Verhulst模型进行动态改进;最后,结合实例分别运用GM(1,1)模型、Verhulst模型、动态Verhulst模型进行拟合和预测。结果表明,动态Verhulst模型能更准确地拟合高层建筑的沉降发展趋势,预测精度提高30%,动态Verhulst模型的预测结果精度更高、可靠性更强。
-
-
范圣法;
张先梅;
虞慧群
-
-
摘要:
高校在长期的教学活动中积累了大量的课程数据,如何利用数据资源分析课程教学状况,为提高课程教学质量提供决策支持,具有重要的研究价值。本文设计实现了一个基于关联规则与聚类分析的课程评价体系,对课程评价系统进行了功能需求分析,并对课程评价数据进行预处理。采用FP-growth算法对学生课程成绩数据进行关联规则分析,采用K-means++算法进行聚类分析,提高了课程数据分析的精度,实现了课程评价的自动化,提高了效率和评价的客观性。
-
-
高望
-
-
摘要:
案例教学法是一种旨在提升学生解决实际问题的教学方法。本文针对Python课程中的教学难点,将数据预处理工程案例融入到教学实践过程中。首先,利用Python爬虫采集新闻网站的相关数据;其次,利用所学知识对新闻文本进行清洗、分词、特征向量化等数据预处理操作;最后,通过Python第三方库建立文本分类模型,并对模型性能进行评估。将该案例应用于Python语言基础的教学过程中,可以帮助学生更好的理解理论知识,并培养学生利用Python分析解决工程问题的能力。
-
-
庄黎明;
谢海宁;
陆健;
尹建坤
-
-
摘要:
以准确和高效检测配网设备故障为研究核心,提出基于数据挖掘的配网设备故障智能检测方法。采用基于时间序列的配网设备运行数据预处理方法,预处理配网设备运行数据中的噪声点异常数据,提高数据质量;将预处理数据导入基于数据挖掘的配网设备故障智能检测模型中,计算配网设备运行故障的概率,定位存在故障的配网设备位置,实现配网设备故障智能检测。结果表明:配网设备故障检测精度高,可实时检测配网设备故障。
-
-
李拓;
张贞雷;
邹晓峰;
刘同强;
周玉龙;
魏红杨;
王贤坤;
展永正
-
-
摘要:
针对传统视频压缩控制方案存在的频繁读写数据占用大量系统总线带宽等弊端,对传统视频压缩控制系统进行优化。为了高效地对原始视频进行实时压缩,设计丢帧模块、数据预处理模块等模块;为了减少视频压缩IP核(Intellectual Property core,IP core)对外部双倍速率同步动态随机存储器(Double Data Rate SDRAM,DDR)的访问,降低总线带宽,设计了BLOCK转换模块。同时,设计了动态+静态的组合丢帧机制,增强了对不同DDR容量的适配性,提高整体系统性能。
-
-
董继宏
-
-
摘要:
近年来,倾斜摄影技术发展迅速,倾斜影像具有冗余度大、重叠度高、畸变大等特点,对空三解算带来了挑战,空三解算成功率低。针对这一问题,本文从倾斜影像的特点出发,对其关键步骤进行分析,给出解决方案,并以实际生产数据,采用Mirauge3D软件进行实景三维模型的生产,最后利用检测点对模型精度进行检测。结果表明:通过数据预处理,空三解算效率提高,空三解算成功率得到提升,并且模型精度可以达到4.5cm,可以满足1:500地形图生产需求,为大比例尺地形图生产提供了切实可行的方案。
-
-
王有帅;
陈梅;
陈艺丹
-
-
摘要:
近年来,重工业的快速发展加剧了空气质量下降,环境治理变得尤为重要.然而,在国内外现有的空气质量评估系统大多形式单一、准确度低、评估范围有限,并不能较精确的以多样化的形式展示空气质量情况.本文设计实现了一套集数据收集、标准化处理及空气质量评估为一体的空气质量评估系统.该系统采用网络爬虫从空气质量监测网站获取数据,并对数据进行抽取、清洗、单位转化、污染物分类及多种标准化方法处理,提高空气质量的评估精确度.系统评估方式多样,有按时、日、月、监测站位置及污染物种类等,解决了大多数空气质量评估系统形式单一和评估不准确的问题.该系统可以为用户提供实时的空气质量情况,还可以为大气污染相关科研人员提供准确的数据预处理结果.系统运行稳定可靠,界面友好,功能丰富,能满足空气信息综合管理评估的需求.
-
-
陈静;
谭爱国;
钟建伟
-
-
摘要:
针对电力负荷序列不稳定且传统的神经网络在电力负荷预测中预测精度较低等问题,提出了门控循环单元神经网络(Gated Recurrent Unit Neural Network, GRU)负荷预测的方法。利用python编程语言在Tensorflow框架在搭建门控循环单元神经网络,将影响电力负荷的特征数据输入模型中进行训练。通过和人工神经网络(Artificial Neural Network,ANN)模型对比,可得出门控循环单元神经网络模型的效果要优于传统神经网络。
-
-
-
-
摘要:
《淡水生物水质基准推导技术指南》首次修订3月11日,生态环境部发布了《淡水生物水质基准推导技术指南》。这是《淡水水生生物水质基准制定技术指南》发布以来的首次修订。修订后的技术指南,调整了适用范围,细化了部分技术要求,优化了基准推导模型和方法。特别是在毒性数据预处理方面,针对每个步骤细化了毒性数据筛选技术要求,进一步明确了基准研制过程中毒性数据优先序;吸纳了国际上最新研究成果,引入同效应毒性值的概念;“最少毒性数据需求”由“5个类群”“5个物种”增至“6个类群”“10个物种”,达到国际较高要求,增强了水质基准推导的确定性。
-
-
齐智江
-
-
摘要:
入侵检测是通过收集系统内外部用户活动行为数据,在数据分析基础上准确识别异常行为的一种技术。基于数据挖掘的入侵检测系统,除了超前识别入侵行为外,还能提供针对性的防控措施,切实保障系统运行安全和用户隐私安全。本文首先介绍了几种常见的计算机入侵检测数据挖掘模型,如基于流量异常的入侵检测模型、基于协议滥用的入侵检测模型、基于混合算法的入侵检测模型等。随后通过构建入侵检测实验原型系统,在此基础上进行了用户异常行为检测的实验验证。结果表明,基于数据挖掘的入侵检测原型系统,在检测准确性、降低误报和漏报方面均有良好表现,达到了理想的保护效果。
-
-
-
-
王冰;
战桂芳
- 《2020年基础教育研究论坛》
| 2020年
-
摘要:
基于云计算的智能交通服务可以随时采集到所有服务的需求,并依照需求发送对数据的采集命令,满足对数据实时性的要求.同时由于较强的计算能力支撑,并通过软件算法并行化等技术,加快了数据的处理速度,真正意义上满足实时性的要求.
-
-
郭文记;
虞功亮;
刘昕悦;
陈友信
- 《中国水利学会2018学术年会》
| 2018年
-
摘要:
随着中国经济的高速发展,水环境污染和生态破坏日益严重,迫切需要中国政府主管部门升级换代传统的水环境监测技术,满足监测的高精度、大尺度、适时性需求.本文提出了一种利用无人机载高光谱成像技术进行水环境监测的方法.采用国产化研制的机载高光谱成像仪,通过合理的光谱数据预处理和水体要素建模分析流程,可定量化分析高精度、大尺度的水体参数,并在实际项目中得到应用,为进一步开展国产化的水环境多参数监测平台系统研究提供强有力的技术支撑.
-
-
胡远樟;
温川飙
- 《第五届中国中医药信息大会》
| 2018年
-
摘要:
随着信息化的发展,数据挖掘技术为诸多行业的信息化作出了突出贡献,数据挖掘也为探究中医奥秘打开了一扇崭新的窗户.医学数据挖掘在疾病的诊断和治疗、医学科研与教学、医院管理等方面发挥巨大的作用.通对糖尿病大量临床数据的预处理,可以为下一步的中医数据挖掘提供干净、有效的数据,帮助从海量的数据中发现潜在规律,提高中医药对糖尿病的诊断与防治.
-
-
刘健;
方达里;
谭海涛
- 《雅砻江虚拟研究中心2018年度学术年会》
| 2018年
-
摘要:
粗差定位是水工安全监测数据预处理中的一项重要工作.对比介绍了几种粗差定位的几种方法,并讨论其适用范围和局限性.基于正态分布函数,传统的粗差定位技术无法适应长序列大样本监测数据所面临的外界动态荷载条件;通过“3σ准则”改进而得到的逻辑检验法能够顾及监测值在时序上的相关关系;ARIMA建模的方法适用于在时间上较为连续的监测序列粗差探测;统计模型分析可定位有明确相关影响因子的监测效应量中的粗差点;灰色系统GM(1,1)、GM(2,1)模型适用于贫信息数据的粗差识别;根据仪器性能及工作原理可对特定类型的监测仪器的异常测值进行判断.研究成果具有一定的参考价值.
-
-
Xin Jiang;
蒋欣
- 《2018年全国钢桥技术交流会暨第十一次学术年会会议》
| 2018年
-
摘要:
大跨桥梁结构随着服役时间的延长,在车辆荷载和环境因素的综合作用下,难免出现病害或损伤.健康监测系统的建立就是为了通过对环境因素和桥梁结构反应的在线监测,实时掌握桥梁结构状态,及时发现桥梁缺陷,为桥梁管养决策提供依据.基于国外和国内大跨桥梁结构健康监测应用实例的调研分析,对结构健康监测内容与趋势进行了分析.另外,对如何有效开展海量原始监测数据的预处理提出了相关建议.
-
-
-