您现在的位置: 首页> 研究主题> 变量选择

变量选择

变量选择的相关文献在1984年到2023年内共计594篇,主要集中在自动化技术、计算机技术、经济计划与管理、化学 等领域,其中期刊论文512篇、会议论文11篇、专利文献74714篇;相关期刊273种,包括统计与信息论坛、统计研究、重庆工商大学学报(自然科学版)等; 相关会议11种,包括中国卫生统计(生物统计)2014学术年会、全国第四届近红外光谱学术会议、第五届全国环境化学大会会议等;变量选择的相关文献由1390位作者贡献,包括宦克为、赵环、刘小溪等。

变量选择—发文量

期刊论文>

论文:512 占比:0.68%

会议论文>

论文:11 占比:0.01%

专利文献>

论文:74714 占比:99.30%

总计:75237篇

变量选择—发文趋势图

变量选择

-研究学者

  • 宦克为
  • 赵环
  • 刘小溪
  • 石晓光
  • 韩雪艳
  • 李太福
  • 王延新
  • 田茂再
  • 苏盈盈
  • 赵培信
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 张明; 付冬梅; 程学群; 杨丙坤; 郝文魁; 陈云; 邵立珍
    • 摘要: 突变是工程实践过程中广泛存在的现象.当系统的状态发生跳跃性变化时,基于微积分的传统数学建模方法精度较低,人工神经网络等机器学习算法无法对突变现象作出合理的解释.基于突变理论的尖点突变模型可以用来解释系统状态的不连续变化,然而在输入变量维度较大的情况下,传统的尖点突变模型复杂度高且精度较差.为了解决这一问题,提出了一种基于变量选择的尖点突变模型的两步构建方法.第一步,利用多模型集成重要变量选择算法(MEIVS)量化待选变量的重要性并提取重要变量;第二步,基于极大似然法(MLE)利用所提取的重要变量构建尖点突变模型.仿真结果表明,在具有突变特征的数据集上,通过MEIVS降维后的尖点突变模型在评价指标上优于线性模型、Logistic模型和通过其他方法降维的尖点突变模型,并且可以用来解释研究对象的不连续变化.
    • 姚菲
    • 摘要: 年轻人刚步入社会,租房是必不可少的一项开销,解决年轻人的租房问题是城市可持续发展的必然要求。影响房租价格的变量众多,变量选择是处理高维数据非常重要的一个环节,变量选结果的好坏决定了所建模型性能的优劣。引入BP神经网络模型,对权重施加L1惩罚,多次模拟后设定一个阈值,将权重相加值小于阈值的变量剔除,经检验该方法具有非常良好的变量选择性能。以长沙市中心城区为例,爬取贝壳找房网上5个地区的租房信息,并利用百度地图API获取房屋周边环境信息,得到18个自变量,进行变量选择探究影响房租价格的重要因素。结果表明租赁方式和房屋户型对房租价格的影响最大。
    • 王小燕; 周思敏; 徐晓莉; 周四军
    • 摘要: 碳交易作为实现低碳经济的一种途径,既具有环境效益,又具有经济效益。为了研究碳排放权价格的影响因素,选取广州碳排放权交易所的碳配额价格收盘价(GDEA)为研究对象,从6个维度构建了24个指标:国际碳价、国内外经济指标、国外能源指标、国内能源指标、气候环境和宏观政策,并将指标间复杂的相关关系纳入模型来改进指标筛选效果。首先基于复杂网络理论构建了24个指标的图结构,表示它们的复杂联动关系,再建立图结构自适应Lasso方法(G-AdLasso)进行影响因素识别。研究发现:指标之间存在无可忽视的中等或高度相关,依据两两相关关系建立图结构时,上述24个指标可被分为6个团体,体现了指标的内部关系。同时G-AdLasso选择出了10个因素,其中欧盟核证减排量收盘价影响最为显著,欧盟EUA收盘价、迪拜原油现货价、美元兑人民币中间价4个因素对GDEA有正向影响;欧盟CER收盘价、NYMEX天然气期货收盘价、欧洲三港DES ARA动力煤指数、广州工业天然气市场价、广州日最高气温、银行间7日同业拆借平均利率、欧元兑人民币中间价7个因素对GDEA有负向作用;这些因素在上述6个维度上均有涉及,且它们在图结构中具有较高的度,说明G-AdLasso可识别出图结构中较重要的指标。对比不带图结构的自适应Lasso和Lasso方法,G-AdLasso方法选择更少的指标,说明该方法可优化和精简模型。
    • 吴昊; 赵培信; 黄海霞
    • 摘要: 利用函数数据的非参数核回归方法以及惩罚绝对偏差估计技术,对函数型部分线性模型的变量选择问题,提出了一种稳健的重要变量选择方法.通过数值模拟仿真显示所提出的方法可以消除异常点对变量选择精度的影响,具有较好的稳健性.
    • 高启兵; 于欢; 时倩倩; 朱桂梅
    • 摘要: 针对自适应设计广义线性模型,研究自适应Lasso惩罚最小二乘变量选择方法。在一定条件下,得到自适应Lasso惩罚最小二乘估计的相合性和Oracle性质,该结果将固定设计广义线性模型相关结果推广到自适应设计广义线性模型中。通过模拟可知,自适应Lasso惩罚方法优于Lasso惩罚方法。
    • 曾维佳; 张日权
    • 摘要: Lasso是机器学习中比较常用的一种变量选择方法,适用于具有稀疏性的回归问题.当样本量巨大或者海量的数据存储在不同的机器上时,分布式计算是减少计算时间提高效率的重要方式之一.本文在给出Lasso模型等价优化模型的基础上,将ADMM算法应用到此优化变量可分离的模型中,构造了一种适用于Lasso变量选择的分布式算法,证明了该算法的收敛性;同时,我们通过数值实验,将本文构造的分布式算法与循环坐标下降法和ADMM算法进行了比较分析,结果显示在处理样本集大的稀疏性回归问题时,本文提出的算法的计算时间和误差都小于其他两种算法.
    • 薛娇; 傅德印; 高海燕; 韩海波
    • 摘要: 稀疏惩罚分位数回归是高维数据分析中进行变量选择和稳健估计的重要工具。对于具有分组解释变量的问题,期望达到组内和组间稀疏的理想效果,但是许多现有方法未能实现这一目标。文章将自适应Lasso和自适应Group Lasso相结合,构建了一种自适应稀疏Group Lasso惩罚分位数回归(Q-AdSGL)模型,给出了基于ADMM算法的模型求解方法,并讨论了估计量的Oracle性质。通过Monte Carlo模拟研究和实例分析证明了所提模型和算法的有效性。
    • 秦喜文; 王芮; 张斯琪
    • 摘要: 乳腺癌基因数据的分类研究在临床医学上具有重要意义。针对基因数据的结构复杂、高维小样本等特点,提出一种最大相关最小条件冗余和深度级联森林结合的基因数据分类方法。选取博德基因研究所乳腺癌基因表达数据集,共98个数据作为样本,每个样本包含1 213个特征基因。首先对数据进行标准化处理,然后利用最大相关最小条件冗余选取特征子集,最后使用深度级联森林对特征子集进行分类。将随机森林、支持向量机和BP神经网络作为对比方法。结果表明,所提出的最大相关最小条件冗余和深度级联森林结合方法的最佳分类准确率达到93.78%,明显优于其他方法。该方法能有效提高乳腺癌基因数据的分类准确率,对基于基因数据的乳腺癌分类具有重要的理论意义与实用价值。
    • 摘要: ○胃肠道放射学胃癌上皮间质转化分子亚型的CT预测(DOI:10.19300/j.2022.e0101)Prediction of epithelial-to-mesenchymal transition molecular subtype using CT in gastric cancer(DOI:10.1007/s00330-021-08094-3)D.I.Cha,J.Lee,W.K.Jeong,S.T.Kim,J.H.Kim,J.Y.Hong,et al.摘要目的本研究旨在利用CT影像建立预测模型,并建立包含已知临床病理变量的列线图,从而用于上皮间质转化(EMT)亚型胃癌的个体化评估。方法回顾性分析451例行胃癌(GC)一期切除术和进行了分子亚组分析的病人。首先采用逐步变量选择法进行多变量分析,建立EMT亚型GC的预测模型。利用多变量分析的结果构建一个列线图。
    • 夏亚峰; 何佳
    • 摘要: 利用对数似然函数和自适应桥惩罚估计方法研究了高维数据下广义线性模型的参数估计和变量选择问题,利用对数似然函数和自适应桥方法构造惩罚估计目标函数,在适当的正则条件下,证明了自适应桥估计量的相合性和Oracle性质,通过数值模拟和实例分析验证了所提方法的有限样本性质及其优良性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号