特征筛选
特征筛选的相关文献在2001年到2022年内共计289篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文132篇、会议论文6篇、专利文献117492篇;相关期刊108种,包括科学技术与工程、中国卫生统计、现代生物医学进展等;
相关会议6种,包括第五届国防科技工业试验与测试技术发展战略高层论坛、第六届全国信息检索学术会议、中国高等学校电力系统及其自动化专业第二十五届学术年会等;特征筛选的相关文献由877位作者贡献,包括来鹏、周俊、张涛等。
特征筛选—发文量
专利文献>
论文:117492篇
占比:99.88%
总计:117630篇
特征筛选
-研究学者
- 来鹏
- 周俊
- 张涛
- 王力
- 陈超超
- 吴骏
- 周先亭
- 张巨岩
- 张芳
- 李康
- 李战怀
- 李月龙
- 李海峰
- 李爽
- 王伟
- 王娟
- 王学彬
- 耿磊
- 肖志涛
- 胡海峰
- 苏静静
- 薛峰
- 袁哲明
- 谢丽霞
- 贾慧珣
- 邓珍荣
- 陈渊
- 马琳
- 黄文明
- 龙红
- LI RunZe4
- 万艳玲
- 乔彦辉
- 于婷
- 付忠军
- 付波
- 代志军
- 任浩
- 任红梅
- 何东健
- 何建民
- 何晓
- 何智福
- 何琰
- 何胜美
- 余小清
- 侯慧
- 傅冬和
- 傅永康
- 冯大政
-
-
夏伟怀;
刘嘉莉;
冯芬玲
-
-
摘要:
为提升铁路冷藏运输效率和实现铁路冷藏运输资源的合理配置,推进铁路冷藏运输的快速发展,对铁路冷藏运输需求进行预测尤为重要。在分析铁路冷藏运输影响因素基础上,利用Spearman相关性分析进行特征筛选。结合Spearman相关性分析结果,构建基于随机森林的铁路冷藏运输需求预测模型,并与BP神经网络,AdaBoost,Bagging和未经特征筛选的随机森林预测模型的预测结果进行对比分析。研究结果表明:经Spearman相关性分析进行特征筛选后构建的随机森林回归预测模型的平均绝对误差和拟合优度值均优于其他模型,均方根误差值仅高于BP神经网络。随机森林回归预测模型的泛化能力较好,且特征筛选能够提高模型的预测精度。
-
-
杜雪平
-
-
摘要:
雌激素受体α亚型(ERα)被认为是乳腺癌内分泌疗法的重要靶标。本文采用随机森林、支持向量机和多元线性回归方法,对1974个化合物建立ERα抑制剂活性预测模型。利用方差过滤法和Lasso回归思想筛选分子描述符,使用均方误差MSE来评估模型的预测效果。采用随机森林、支持向量机和多元线性回归方法在训练集和测试集上的均方误差分别为0.475和0.553、0.653和0.792、0.709和0.801。结果表明,随机森林优于其他机器学习方法,用于ERα抑制剂的活性预测具有良好的稳健性和预测能力。
-
-
郑剑国
-
-
摘要:
据不完全统计显示,2020年全球乳腺癌新增人数达到226万,女性乳腺癌是最常见的癌症类型,死亡率高居第五,因此对乳腺癌的治疗研究变得愈发重要。对雌激素受体α亚型(ERα)的研究显示其在乳腺发育过程中扮演重要角色。本文收集作用于ERα的化合物及其生物活性数据,并以一系列分子结构描述符作为自变量和以化合物的生物活性值作为因变量,通过随机森林与梯度提升树并融合专家知识来构建分子筛选模型,筛选出前20个对生物活性最具有显著影响的分子描述符。这些分子描述符对指导已有活性化合物的结构优化和药物研究具有重要意义。
-
-
许镇义;
王瑞宾;
康宇;
曹洋;
张聪;
王仁军
-
-
摘要:
由于移动源污染遥感监测受到复杂外部环境影响,难以通过传统统计方法建立车辆行驶工况与污染排放之间的相关性模型,为此开展了基于移动源遥感监测的影响因素分析及排放预测的研究。首先利用Spearman相关性分析排除与移动源污染物主要排放气体CO、HC、NO气体浓度无相关性的因素;其次使用Lasso算法确定各成分的关键影响因子,并采用神经网络构建污染物排放预测模型;最后在测试集上验证该模型用于移动源污染排放主要成分预测的有效性。模型预测的结果表明,基于特征筛选的移动源污染排放数据预测神经网络模型具有较高的预测精度,可以降低城市移动源污染排放检测成本并为相关部门制定相关政策提供数据支持。
-
-
邓平;
吴明辉
-
-
摘要:
针对现有基于惯性传感器的人体运动姿态识别中涉及特征较多、常用姿态识别方法不全面、识别精度不足等问题,开展了人体正常行走、跑步、后退、左右侧步、上下楼梯等多种运动姿态识别及修正算法研究,通过特征提取与建库、特征筛选、姿态识别与修正等过程进行人体的运动姿态判定。首先详细阐述了在人体多姿态运动场景下的特征数据提取过程以及基于多信息融合的特征筛选方法。然后针对人体运动姿态误判,提出了基于人体运动连贯性检测的姿态修正算法。最后搭建多分类器并利用选取特征数、识别准确率、修正结果等数据对所提出的算法进行了验证。实验结果表明,所提出的算法以平均8个特征值使得人体运动姿态识别准确度达到98%,并通过修正算法可将识别准确度提升至99.67%,以少量的特征数目达到了更高的多姿态分类准确率。
-
-
高静;
陈晓静;
陈晓林
-
-
摘要:
针对超高维竞争风险数据,提出并研究了一种新的基于距离相关的特征筛选方法.从理论和数值模拟两方面对新提出的方法进行了研究.理论上证明了新方法的确定性筛选性质.数值上的结果表明,新提出的方法比现有筛选方法有更好的表现,并将新方法应用到了一个实际问题.
-
-
李春生;
张圣权;
张岩;
张可佳
-
-
摘要:
复合驱由于强碱化学剂的注入易造成严重的结垢现象,而预测清防垢加药量是制定科学的清防垢方案的关键。为了获得一种具有较强实用价值和较高预测精度的复合驱清防垢加药量的预测方法,该文将随机森林回归算法应用到复合驱清防垢加药量预测。首先,分析并处理影响清防垢加药量的20维特征,利用随机森林回归的特征重要性评估功能对影响加药量的众多特征进行筛选;然后,通过网格搜索和K折交叉验证的方式得到最优参数组合,建立随机森林回归的复合驱清防垢加药量预测模型;最后,通过大庆市某采油厂三元复合驱某区块的清防垢数据,验证预测模型的有效性,并与CART回归、SVM回归和ANN进行对比。实验结果证明,该方法可以实现清防垢加药量的有效预测,较对比模型的预测精度高出约23%,且其预测效果较为稳定,同时经过特征筛选的方式可以提高模型的预测精度,约比未经特征筛选的随机森林回归模型高1.86%。
-
-
佟敏;
陈忠源;
党乐;
崔亚茹;
马善为;
李凯
-
-
摘要:
天然气是一种绿色高效的能源,准确预测其需求量对于天然气政策制定、生产和贸易等均具有重大意义。传统的回归分析、灰色模型等方法对天然气需求量预测仅仅考虑时间因素,无法保证预测的准确性。近年来,基于人工神经网络的天然气需求量预测被证实是一种高效准确的方法,但目前研究主要集中于算法优化,而对于天然气需求量影响因素的研究则较少。基于此,采用灰色关联度法(GRA)、平均影响值法(MIV)和主成分分析法(PCA)对天然气需求量影响因素进行了特征筛选,以简化和优化神经网络模型,提高预测的准确性和精度。研究结果表明:①三种方法均能显著降低神经网络预测误差,其中MIV法效果最佳,预测的平均相对误差从9.077%降至0.983%;②较之于传统的灰色预测模型,通过三种方法特征筛选的BP神经网络模型对2019-2025年的天然气需求量预测结果基本一致,而灰色模型预测结果偏大,表明所建立模型预测精度较高,结果可靠,可以用于对天然气需求量的中长期预测。
-
-
余帆;
王磊;
江巧永;
闫群民;
皇金锋
-
-
摘要:
对短期负荷进行准确、快速的预测有利于电力系统的安全稳定运行,故提出一种基于特征筛选的Informer短期负荷预测模型.针对短期负荷序列波动性大、随机性强的特点,利用变分模态分解(Variational Mode Decomposition,VMD)将原始负荷序列分解为不同频率的本征模函数(Intrinsic Model Function,IMF);考虑气象、地理、电价等影响因素,采用最大信息系数(Maximal Information Coefficient,MIC)对各IMF进行特征筛选;针对传统深度学习模型无法并行化、预测精度低的问题,应用了前沿的Informer模型进行短期负荷预测,同时利用了新颖的麻雀搜索算法(Sparrow Search Algorithm,SSA)进行模型参数优化.以西班牙区域级负荷数据为实例,同多层感知机(Multilayer Perceptron,MLP)、长短时记忆神经网络(Long Short-term Memory Neural Network,LSTM)和门控循环单元(Gated Recurrent Unit,GRU)进行横向与纵向实验对比,结果表明,提出的模型预测精度更高,平均绝对百分比误差低于1%.
-
-
钟彩;
杨亚鑫;
王璟德;
孙巍
-
-
摘要:
基于不同的机器学习方法探索识别抗肿瘤药的合适的特征筛选方法。收集了200个抗肿瘤药和600个非抗肿瘤药,形成三组不同的平衡数据集。采用斯皮尔曼系数与谷本系数计算的相关性矩阵与6个特征重要性指标结合进行相关性特征筛选。筛选后的数据集使用自适应提升树、随机森林、支持向量机进行分类。基于三个平衡数据集,采用的特征筛选方法对不同的机器学习方法获得的评价指标均有不同程度的提升。特别是自适应提升树,与其他筛选操作相比,至少有一种改进的特征筛选方法提升了六个评价指标的所得值。根据三个数据集的结果分析,重要性指标中整体方差和信息熵表现得更好,为将来的抗肿瘤药物识别提供一定的参考。
-
-
路锋;
冯辅周
- 《第五届国防科技工业试验与测试技术发展战略高层论坛》
| 2014年
-
摘要:
通过引入信息熵的概念作为特征优劣的评价参量,提出一种基于信息熵的柴油机振动信号特征筛选方法.首先利用混叠熵和误差熵对柴油机振动特征信号进行筛选,降低特征规模,然后计算相似系数利用相关度消除冗余特征.装甲车辆某型柴油机台架试验振动信号数据特征筛选结果符合振动传递规律和柴油机故障机理,表明该方法是有效的.
-
-
-
-
-
-
李洪伟;
卢锦玲
- 《中国高等学校电力系统及其自动化专业第二十五届学术年会》
| 2009年
-
摘要:
在大规模电力系统中,暂态稳定分析是一个高度复杂的非线性问题。反映暂态稳定状态的特征很多,选用合适的输入特征变量,即哪些与稳定性或稳定指标强关联的参数、变量,是获得较好的暂态稳定评估结果的关键因素之一。本文将灰色关联优化排序与聚类分析进行有机结合,不仅可以实现聚类分析随阀值的变化而得到不同的结果,而且可以进一步分析同一类型中哪种特征更优,或在同类中哪个特征更具代表性。仿真算例证实了该方法的有效性和正确性,为大系统暂态稳定评估的特征选取提供了新思路。