摘要:
掌握土壤在空间和时间上的表征至关重要。土壤可见-近红外(Vis-NIR)光谱可以估算土壤有机碳(SOC)等属性,与传统的实验室理化分析相比,光谱技术能有效实现土壤信息的快速获取。土壤光谱库为建立经验模型提供了大量具有丰富变异性和多样性的样本作数据基础。但受限于库中土壤样本的异质性和模型的适应性,通常区域或局部尺度模型的稳健性欠佳。已有的研究主要通过目标样本部分入库的方式改善库的性能,但影响了光谱技术的低成本优势。该研究在不入库的前提下基于土壤光谱的相异度,探究经典距离算法结合土壤光谱库构建局部预测模型的可行性,并比较分析局部模型样本容量对预测精度的响应。基于全球土壤光谱库(GSSL)的677个土柱,从每个国家随机取十分之一的土柱(97个)组成局部目标测试集(Test),其余580个作土壤光谱库(SSL)。分别采用欧氏距离(ED)、马氏距离(MD)、和光谱角(SAM)来分别度量Test与SSL间的光谱相异度并生成距离矩阵。按距离矩阵的前0.04%,0.05%,0.1%,0.2%,0.3%,0.4%,0.5%,1%和5%从SSL中提取与Test最相似的光谱样本构建共计9个容量的局部建模集(Local),使用偏最小二乘回归(PLSR)建立Vis-NIR和SOC含量的预测模型并通过Test验证模型精度,通过光谱的主成分空间考察并解释各种距离算法下Local的“容量–精度”变化。结果表明,在待测样本不入库的情况下,三种距离算法构建的Local模型相较于全局模型的预测精度均有一定提升,但三者的“容量-精度”的拐点存在显著差异。SAM兼顾了光谱的波形和幅度因此较MD、ED更具优势;其前0.2%比例的Local不仅预测精度最优,且用于建模所需的样本容量最少。因此认为,SAM法更适用于从土壤光谱库中构建局部模型,距离矩阵的前0.2%可作为局部模型的容量参考。