您现在的位置: 首页> 研究主题> 哑变量

哑变量

哑变量的相关文献在1986年到2022年内共计117篇,主要集中在林业、自动化技术、计算机技术、财政、金融 等领域,其中期刊论文116篇、专利文献11192篇;相关期刊55种,包括武夷学院学报、林业勘察设计、林业科学等; 哑变量的相关文献由294位作者贡献,包括江希钿、华伟平、曾伟生等。

哑变量—发文量

期刊论文>

论文:116 占比:1.03%

专利文献>

论文:11192 占比:98.97%

总计:11308篇

哑变量—发文趋势图

哑变量

-研究学者

  • 江希钿
  • 华伟平
  • 曾伟生
  • 张冬燕
  • 王冬至
  • 邓华锋
  • 吴宏炜
  • 庄崇洋
  • 张伟志
  • 孙晓梅
  • 期刊论文
  • 专利文献

搜索

排序:

年份

    • 黄金金; 刘晓彤; 张逸如; 李海奎
    • 摘要: 【目的】建立区域尺度林分生物量生长模型,为预测未来某一时段广东省天然阔叶林生物量和碳储量提供方法学支持。【方法】基于广东省1997−2017年5期森林清查数据,选择栎类、木荷和其他软阔类等6个阔叶树种为优势树种的203个天然林样地,以参数分级反映立地质量差异,以竞争指数表示密度影响,以分步建模(一元非线性回归法)和联合建模(非线性联立方程组法)区别建模方式,采用理论生长方程构建胸径生长模型估计林龄进而构建多种林分生物量生长模型,以决定系数和平均预估误差等4个指标评价模型拟合优度;对拟合优度较高的模型,以2002−2017年4期连清的183块样地为检验样本,用总相对误差来验证其应用效果。【结果】对比模型拟合效果和区域尺度及样地水平上的估计精度,以探究林分密度、不同参数分级、分级方法和建模方法共4项影响因素对生物量生长模型的效果,结果表明:非线性联立方程组法优于分步建模法;与生长速度有关的参数b分级模型优于与生长潜力有关的参数a分级模型;考虑林木竞争和分级方程中加入竞争指数对优化模型性能影响不大。参数b分级、自变量和分级方程皆不含竞争指数的联合模型(模型10)为最优模型,其生物量生长模型确定系数R^(2)为0.9701;预测4期生物量时,估计效果较好,后期估计误差明显低于前期,如采用模型10预估栎类2002−2017年区域尺度生物量时,4期的估计误差分别为6.22%、15.27%、4.80%、−1.84%。【结论】以Richards理论生长方程为基础构建林分生物量生长模型来估测区域尺度生物量是一种可行的方法,为评估未来某一时段区域尺度森林生态系统的固碳能力提供依据,也为其他区域的林分生物量生长模型研建提供参考。
    • 李颜平; 吴刚
    • 摘要: 针对多种数据预处理方式及其组合如何提升模型拟合效果这一问题,基于UCI Machine Learning Repository典型数据集,分别利用20种变量处理方式和4种变量选择方法对数据预处理,并对模型拟合效果对比分析,分别考查了多种数据预处理方式及其组合对常见分类模型和回归模型的影响.通过对实验结果的分析讨论,提出一种启发式算法,根据数据特征、模型特点以及研究问题种类等信息推荐数据预处理方法.在更广泛的数据集上的实验结果表明,该算法所推荐的数据预处理方法可以一定程度上提升模型拟合效果,节省手工选取数据预处理方法的开销.
    • 罗洪斌; 岳彩荣; 张国飞; 金京; 谷雷; 朱泊东
    • 摘要: 为提高森林蓄积量遥感估测精度,探讨哑变量技术在蓄积量遥感估测中的作用。以云南省普洱市思茅区为研究区,以Landsat 8 OLI和93块森林资源二类调查角规控制样地数据为基础,使用随机森林(random forest)算法进行遥感变量因子的选择,并以龄组为哑变量分别构建基于哑变量的SVR和PLSR蓄积量估测模型,采用留一交叉验证对结果进行评估。结果表明,使用随机森林算法进行变量的选择有效减少了自变量的维度,提高了计算效率;其次,哑变量引入后,PLSR和SVR 2种回归模型的估测精度都比无哑变量方法有明显的提高,且SVR的估测结果优于PLSR;在引入哑变量后SVR模型的决定系数R^(2)由0.59提高到0.68,相对均方根误差rRMSE由36.76%降低至32.97%,PLSR模型的决定系数R^(2)由0.53提高到0.62,相对均方根误差rRMSE由39.41%降低至35.24%。在森林蓄积量的遥感估测中,哑变量技术的应用可以在一定程度上解决不同蓄积量大小对估测结果造成的影响,进而提高蓄积量的估测精度。
    • 刘瑞平; 苏思奇
    • 摘要: 基于某网络文学互联网平台数据,构建同时含有定量变量与定性变量的Logistic回归模型,研究网络文学知识产权(intellectual property,IP)作品是否会被改编为影视剧的影响因素。在实例分析中探讨Logistic回归建模时可能遇到的一些问题,得出结论:关于多分类定性变量的处理,构建哑变量的方式要优于直接进行多水平赋值;模型所得结果中若有截距项显著,则必有某个哑变量被忽略。实例研究结果表明:网络文学IP作品被改编的主要相关因素包括用户粘性、作品讨论热度以及作品题材。
    • 摘要: 1创新点为突破大数据分析瓶颈,项目围绕大数据中的高维缺失数据分析的关键科学问题,开展统计推断理论和方法研究,提出筛选特征和插补缺失数据的新方法,取得一系列突破性研究成果,其主要创新点如下:一是针对大数据的超高维问题,提出筛选特征的新方法。对大数据中的超高维异质属性数据,通过定义与属性水平相关的哑变量
    • 吴宏炜; 张伟志; 田意; 严铭海; 庄崇洋; 江希钿
    • 摘要: [目的]为更好地估测福州市湿地松人工林林分断面积生长情况,同时为湿地松人工林的经营提供参考依据.[方法]基于样地调查数据选用理查德方程、逻辑斯蒂、Mitscherlich和Schumacher等基础模型,引入优势木平均高和年龄因子为自变量并将林分密度指数作为密度指标加入到基础断面积模型中.在最优基础模型中引入哑变量,建立可兼用于采脂与未采脂林分的湿地松人工林断面积模型.利用R软件的遗传算法求解模型参数,采用均方差(RMSE)、残差平方和(SSE)、决定系数(R2)、模型精度(v)和模型准确度(P)等模型评价指标.并运用含熵权值的TOPSIS法对哑变量模型选优,选用的各项评价指标熵权值由其本身数值决定,该方法具有较好的客观性,避免主观因素影响综合评价结果.[结果]4个基础模型的拟合效果均较好,模型决定系数均超过了0.9,其中Schumacher模型为最优基础模型,决定系数达0.98331,模型精度达98.20%.在该模型中b3参数中引入哑变量所得模型拟合效果最优,较最优基础模型决定系数提升到0.99896,模型精度提升到99.37%,距离最优解距离总和最小为0.0000167.并对最优哑变量模型做适用性检验,分别检验模型对采脂林分、未采脂林分和总体林分的拟合效果,发现其预估精度均超过99%.根据检验数据断面积实测值和最优哑变量模型预测值建立的线性回归方程,其R2值达到0.9992,常数项接近0且残差基本均匀分布于横轴两侧,表明模型预估精度较高.[结论]引入哑变量后模型拟合效果得到了提升,可用于估测采脂与未采脂不同经营措施湿地松林分断面积,为测算湿地松林分材积与规划林分经营模式提供参考.
    • 王洪山; 王自仲; 李志鹏
    • 摘要: 以湖南省15个栎类固定样地为研究对象,从6种生长模型中选取栎类断面积最优基础模型,在此基础上构建含林分类型哑变量的栎类单木断面积生长模型.结果表明:栎类单木断面积最优基础模型为Logistic;单木哑变量模型相比于其它基础模型,模型的R2由0.785提高到0.869,RRMSE由16.65%减少到9.28%,模型精度显著提高;在栎类+杉木林林分类型中,栎类断面积生长较快,生长速率优于其它2种林分类型.含林分类型的哑变量模型在拟合优度方面高于基础模型,说明栎类断面积生长受林分类型的影响,构建栎类单木断面积模型可为不同林分类型下栎类的生长预估提供参考.
    • 金京; 岳彩荣; 李春干; 谷雷; 罗洪斌; 朱泊东
    • 摘要: 基于机载LiDAR数据,分析哑变量对林分蓄积量估测精度的影响.以广西高峰林场为研究对象,借助机载激光雷达点云数据和96个样地数据,将样地数据按7:3的比例随机划分为建模样本和测试样本,采用随机森林模型(RFR)和支持向量机模型(SVR)对建模样本与对应的点云特征回归建模,将树种组(针叶林和阔叶林)和龄组分别作为哑变量引入到回归模型.利用测试样本的估测精度评价模型的估测精度,引入树种组哑变量,随机森林模型决定系数R2从0.59提高到0.64,支持向量机模型决定系数R2从0.49提高到0.50.引入龄组哑变量,随机森林模型决定系数R2从0.59提高到0.65,支持向量机模型决定系数R2从0.45提高到0.55.根据模型的建模精度和验证精度结果得出,引入哑变量对蓄积量估测模型的精度提升是相对有效的.龄组哑变量对模型精度提升效果优于树种组哑变量.
    • 王雪峰; 陈珠琳; 管青军; 刘嘉政; 王甜; 袁莹
    • 摘要: [目的]针对森林碳储量估算工作量大、成本高等问题,提出一种基于林内图像简洁高效且满足精度要求的单位面积森林碳储量估计方法.[方法]林分纵断面图像隐式包含林分密度和高度2类复合信息,与林地上对应的林木碳储量直接相关.以此为突破口,首先,分析林木图像分类算法,提出在全局阈值基础上结合邻域像素属性来决定焦点像素归属,以消弱因林内光线不均对图像灰度造成的影响;然后,提出一个与林木碳储量关系紧密的参数并给出其图像计算方法;最后,以该参数为自变量,建立预估模型,实现对碳储量的估计.[结果]在以焦点像素为中心的3×3的邻域内,如果有大于6个相似像素出现,则将焦点像素归为该类,这种利用与邻域像素关系以决定当前像素归属的方法具有膨胀和腐蚀双重特性,即当焦点像素处于树体内部时容易将该点归为树体,当焦点像素处于树体外部时容易将该点归为背景,相比单纯全局阈值方法更能提高林分图像分类的准确性.碳储量预估模型方面,2参数的直线方程估计精度与3参数的逻辑斯蒂模型接近;如果在普通模型基础上增加代表海拔的虚拟变量,则能使碳储量估计精度得到较大程度提高.以兴安落叶松为例,验证基于林内纵断面图像能够实现对单位面积碳储量的较高精度估计这一假设.[结论]在林木图像提取过程中,继承对称交叉熵法泛用性强、效率高的优点,同时针对该算法容易将树体内部部分像素分割成背景、树体外部部分像素归并于树体内部的缺点,采用兼顾像素邻近关系的方法对其进行改进,取得良好结果,且该算法对林内光线不均表现出迟钝特性.在基于林内图像的碳储量预估模型方面,逻辑斯蒂模型表现出良好适应性,由于考虑海拔因素能降低估计误差,因此在实际应用中有必要分海拔段进行预估.
    • 晁越; 谭雨昕; 许丹; 黄磊
    • 摘要: 基于哑变量线性变换,结合BIC提出一种渐近相合的探测Logistic回归模型中顺序类别解释变量的伪分类方法,并给出了相应的伪分类筛选算法.通过建立定理严格证明该方法所得到的相合性等统计性质.随后进行了统计模拟试验,并对模拟结果进行了对比,验证了所提出方法的相合性.通过中学生体质测试实际数据的案例分析,对所提出方法的可行性和实用性进行了验证,数据分析结果显示,该方法能够有效地筛选出Logistic回归模型中顺序类别解释变量的伪分类.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号