首页> 中国专利> 一种基于深度学习的大规模遥感影像目标自动识别方法

一种基于深度学习的大规模遥感影像目标自动识别方法

摘要

本发明提供了一种大规模遥感影像目标识别方法,包括:采用深度神经网络对训练遥感影像进行训练,对训练好的深度神经网络添加一个目标分类层,再对该深度神经网络进行调整,得到最优的深度神经网络,通过该最优的深度神经网络对大规模遥感影像进行目标自动识别。本发明能快速和准确的完成大规模遥感影像特征提取,提高特征对遥感影像的光照、角度、尺度和背景等复杂变化的反应性,进而提高大规模遥感影像目标识别的效率。

著录项

  • 公开/公告号CN105654136A

    专利类型发明专利

  • 公开/公告日2016-06-08

    原文格式PDF

  • 申请/专利权人 中国科学院电子学研究所;

    申请/专利号CN201511026790.1

  • 申请日2015-12-31

  • 分类号G06K9/62(20060101);G06N3/08(20060101);

  • 代理机构11021 中科专利商标代理有限责任公司;

  • 代理人宋焰琴

  • 地址 100190 北京市海淀区北四环西路19号

  • 入库时间 2023-12-18 15:42:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-04-18

    专利权质押合同登记的生效 IPC(主分类):G06K 9/62 专利号:ZL2015110267901 登记号:Y2023980036938 登记生效日:20230331 出质人:济钢防务技术有限公司 质权人:济南农村商业银行股份有限公司高新支行 发明名称:一种基于深度学习的大规模遥感影像目标自动识别方法 申请日:20151231 授权公告日:20190111

    专利权质押合同登记的生效、变更及注销

  • 2019-01-11

    授权

    授权

  • 2016-07-06

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20151231

    实质审查的生效

  • 2016-06-08

    公开

    公开

说明书

技术领域

本发明涉及大规模遥感影像解译和识别技术领域,具体是一种通过深度神经网络 建模提取目标特征的遥感影像目标识别方法。

背景技术

遥感影像目标自动识别技术是一种重要的遥感应用技术,它的目的是从海量遥感 影像中自动识别感兴趣的目标并获取其相关信息。遥感影像目标自动识别具有重要的应用 价值,在军用方面,利用遥感影像自动识别技术,有助于实现对目标国家和地区的目标监 视;在民用方面,利用遥感图像的自动识别技术有助于实现对城乡地区的规划和动态监测 等。

最初,实现遥感影像目标识别只能通过人工判读。随后人机交互的半自动化识别 方式逐渐发展,但由于处理耗时多、周期长,这种方式并不能发挥遥感技术的优越性,尤其 是近些年来遥感影像数据规模的逐年累积,使得遥感影像数据步入大数据时代,研究和发 展针对大规模遥感影像的自动识别技术逐渐成为热点。

借鉴计算机视觉和模式识别领域的相关成熟技术,当前用于遥感影像自动识别的 方法主要分为两类:一是自上而下的模型驱动方法,这类方法首先结合领域专家知识定义 目标模型,然后利用实际数据的统计信息修正和改进模型,最后通过模型匹配的方法进行 目标识别,对于特定应用,这类方法可以利用合适的专家知识获得较好的识别结果,缺点是 过程繁多,计算复杂。二是自下而上的数据驱动方法,通过结合计算机视觉中的特征提取方 法和机器学习中的分类器方法进行目标的识别,这类方法由于无需特定专家知识,对于不 同类型的目标识别应用具有较强的适应和推广能力,缺点是现有的特征提取方法往往不能 很好地描述遥感影像目标特征。针对大规模遥感影像,基于计算和时间成本的考虑,后者更 具有现实意义和可行性,但是目前已有的特征提取方法对于遥感影像的光照、角度、尺度和 背景等复杂变化的鲁棒性较差,在大规模遥感影像目标识别中的应用效果不理想。

发明内容

(一)要解决的技术问题

本发明的目的在于,提供一种大规模遥感影像目标识别方法,能快速和准确的完 成大规模遥感影像特征提取,提高特征对遥感影像的光照、角度、尺度和背景等复杂变化的 反应性,进而提高大规模遥感影像目标识别的效率。

(二)技术方案

本发明提供一种大规模遥感影像目标识别方法,包括:

S1,采用深度神经网络对训练遥感影像进行特征学习,其中,所述深度神经网络包 括输入层和隐藏层;

S2,在训练后的深度神经网络中添加一目标分类层,用于对输入至所述深度神经 网络的遥感影像中的目标进行分类;

S3,将待测遥感影像输入至深度神经网络;

S4,通过深度神经网络的前向传播计算所述待测遥感影像分类输出结果,从而得 到待测遥感影像的目标识别结果。

(三)有益效果

本发明根据目标本身的结构,从图像领域出发,利用低秩纹理模型获取其变换参 数,直接得到目标的朝向,相比于传统的旋转不变特征保留了更为完整的信息,使得后续的 检测识别方法可以更为灵活的选择特征描述。另外,采用合理的变换模型,将方向纠正问题 转化为最优化问题,并在循环迭代过程中,逐步逼近目标的方向,能够有效推动遥感图像的 目标识别技术领域的发展。

附图说明

图1是本发明实施例提供的大规模遥感影像目标识别方法的流程图。

具体实施方式

本发明提供一种大规模遥感影像目标识别方法,采用深度神经网络对训练遥感影 像进行训练,对训练好的深度神经网络添加一个目标分类层,再对该深度神经网络进行调 整,得到最优的深度神经网络,通过该最优的深度神经网络对大规模遥感影像进行目标自 动识别。本发明能快速和准确的完成大规模遥感影像特征提取,提高特征对遥感影像的光 照、角度、尺度和背景等复杂变化的反应性,进而提高大规模遥感影像目标识别的效率。

根据本发明的一种实施方式,大规模遥感影像目标识别方法包括:

S1,采用深度神经网络对训练遥感影像进行无监督特征学习,从而对该网络进行 训练,其中,深度神经网络包括输入层和隐藏层;

S2,在训练后的深度神经网络中添加一目标分类层,用于对输入至深度神经网络 的遥感影像中的目标进行分类;

S3,将待测遥感影像输入至深度神经网络;

S4,通过深度神经网络的前向传播计算所述待测遥感影像分类输出结果,从而得 到待测遥感影像的目标识别结果。

根据本发明的一种实施方式,在步骤S1中,将深度神经网络的每一层作为一个单 独的二层网络进行训练,其中第一层为输入层(v),第二层为隐藏层(h),训练时首先将遥感 影像输入到输入层,通过构建输入层与隐藏层的联合概率分布,从而在隐藏层得到输入数 据的一种非线性映射,即得到输入数据的高层特征表示,其中,

输入层与隐藏层满足如下波尔兹曼分布:

P(v,h)=e-E(v,h)Z,

其中,v和h分别为输入层和隐藏层节点,Z为配分函数,其表达式为:

Z=Σv,he-E(v,h),

E(v,h)为能量函数,用于表示输入层节点与隐藏层节点的能量关系,其表达式为:

Eθ(v,h)=-Σi,jviwijhj-Σiaivi-Σjbjhj,

其中θ={w,a,b}为两层网络的参数,vi为输入层节点i,wij为节点i和j的连接权 值,hj为隐藏层节点j,ai为输入层节点i偏置项,bj为隐藏层节点j偏置项;

所述输入层具有最优化的边缘概率分布P(v):

P(v)=ΣhP(v,h),

通过对训练遥感影像的对数概率进行最优化来进行参数估计,其中,基于结构稀 疏优化的损失函数L如下:

L=-logP(v)+μ||P(h=1|v)||1+λ||P(h=1|v)||1,2+η||w||2

其中,-logP(v)为输入层的对数概率分布,||P(h=1|v)||1为节点稀疏惩罚因子, 其表达式为:

||P(h=1|v)||1=Σj|P(hj=1|v)|,

其中,|P(hj=1|v)|表示隐藏节点激活值绝对值,

||P(h=1|v)||1,2为分组稀疏惩罚因子,其表达式为:

||P(h=1|v)||1,2=ΣmΣkGm(P(hk=1|v))2,

其中,m为分组数量,Gm为m组包含的隐藏节点集合,hk为第k个隐藏节点,

||w||2为权值衰减惩罚因子,其表达式为:

||w||2=12ΣjΣiwij2,

利用梯度下降法进行损失函数的最优化,其表达式为:

logP(v)wij=<vihj>-<v^ih^j>,

其中,为损失函数偏导数,和<vihj>分别为训练遥感影像的经验分布和 模型分布的期望。

根据本发明的一种实施方式,在步骤S2中,

在深度神经网络最上层添加一个全连接网络作为目标分类层,将输出特征作为该 目标分类层的输入,同时将目标的类别数量作为目标分类层输出,在该目标分类层中,采用 多类逻辑斯谛回归模型Pj进行目标分类,其表达式为:

Pj=ef(xi)Σkef(xk),

其中,f(xi)=wijxi+bj,多类逻辑斯谛回归模型的输出是一个n维向量,n为目标的 类别数目。

根据本发明的一种实施方式,在步骤S3之前还包括:

对具有目标分类层的深度神经网络进行参数调整,得到最优的深度神经网络。

根据本发明的一种实施方式,在进行参数调整时:

将训练遥感影像输入至所述深度神经网络,得到相应的预测值,计算所述预测值 与所述训练遥感影像的真实值之间的差值,得到差值函数,根据所述差值函数确定优化目 标函数,接着,计算优化目标函数对于参数的梯度值,根据所述梯度值,利用梯度下降算法 进行参数调整,得到优化的深度神经网络参数。

其中,所述差值函数J(W,b)的表达式为:

J(W,b)=12||hw,b(x)-y||2,

其中,hw,b(x)为预测值,y为真实值,W为网络模型权值,

优化目标函数L的表达式为:

L=J(W,b)+βΣjKL(ρ||ρ^j),

其中,β为惩罚系数,ρ为惩罚目标值,ρ可取一个较小值(如0.05),为隐藏节点的 平均活跃度,若平均活跃较小,则每个隐节点为1的概率较低,从而使得隐藏层节点同时只 有很少一部分激活,从而得到稀疏的隐节点。

为稀疏惩罚项,其表达式为:

KL(ρ||ρ^j)=Σj(ρlogρρ^j+(1-ρ)log1-ρ1-ρ^j),

上式可以在优化过程中使接近ρ,从而达到隐节点稀疏的目的,的表达式为,

ρ^j=1mΣiaj(x(i)),

其中,aj(xi)=wijxi+bj

在计算优化目标函数对于参数的梯度值时,首先计算每个隐藏层的输出残差其表达式为:

σik=((Σjwijσjk+1)+β(-ρρ^j+1-ρ1-ρ^j))f(xi),

其中,f'(xi)为激活函数导数,

根据残差计算出目标函数对于参数的梯度值:

wijkJ(W,b)=ajkσik+1bikJ(W,b)=σik+1,

利用梯度下降算法进行参数调整,其表达式为:

wijk=wijk-wijkJ(W,b)bik=bik-bikJ(W,b),

其中,wijk和bik分别为梯度下降第k次迭代时,连接节点i和j的网络权值和第i个输 入层节点的偏置项。经过多次迭代计算就可以得到最优的网络模型

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照 附图,对本发明进一步详细说明。

图1本发明实施例提供的大规模遥感影像目标识别方法的流程图,如图1所示,方 法包括:

步骤1:深度神经网络无监督特征学习。这种特征提取算法将深度神经网络的每一 层作为一个单独的二层网络进行训练,其中第一层为输入层(v),第二层为隐藏层(h),训练 时首先将遥感影像输入到输入层,通过构建输入层与隐藏层的联合概率分布,从而在隐藏 层得到输入数据的一种非线性映射,即得到输入数据的高层特征表示。这种无监督学习策 略可以充分利用大量未标注数据进行参数学习,在大数据应用中拥有很大优势。该步骤具 体方法是:

(1)令输入层与隐藏层满足如下波尔兹曼分布:

P(v,h)=e-E(v,h)Z---(1)

其中v和h为输入层和隐藏层节点,Z为配分函数,用作函数归一化处理,其计算方 法如下:

Z=Σv,he-E(v,h)---(2)

表达式(1)中E(v,h)为能量函数,它表达了输入层节点与隐藏层节点的能量关系, 其计算方法如下:

Eθ(v,h)=-Σi,jviwijhj-Σiaivi-Σjbjkj---(3)

其中θ={w,a,b}为两层网络的参数,w为网络连接权值,a、b分别为输入层和隐藏 层的偏置项。

(2)在该算法中,为了得到隐藏层的特征表示,要最优化输入层的边缘概率分布:

P(v)=ΣhP(v,h)---(4)

(3)算法中通过对输入数据对数概率的最优化来进行参数估计,本专利发明的基 于结构稀疏优化的损失函数如下:

L=-logP(v)+μ||P(h=1|v)||1+λ||P(h=1|v)||1,2+η||w||2(5)其中第一项为 输入层的对数概率分布,第二项为节点稀疏惩罚因子,它是节点激活概率的L1范数,它使得 隐藏层节点稀疏,其计算方法如下:

||P(h=1|v)||1=Σj|P(hj=1|v)|---(6)

表达式(4)中的第三项为分组稀疏惩罚因子,它是节点激活概率的L1,2混合范数, 这里将隐藏层节点分配为多个分组(G),该惩罚因子使得隐藏层在分组上稀疏,其计算方法 如下:

||P(h=1|v)||1,2=ΣmΣkGm(P(hk=1|v))2---(7)

表达式(4)中的第四项为权值衰减惩罚因子,其计算方法如下:

||w||2=12ΣjΣiwij2---(8)

本专利将以上三项组合定义为结构稀疏优化因子。

(4)本发明利用梯度下降法进行损失函数的最优化,其中,损失函数的梯度计算方 法如下

logP(v)wij=<vihj>-<v^ih^j>---(9)

其中<·>表示期望。和<vihj>分别为输入数据经验分布和模型分布的期 望,这里利用吉布斯采样或者其近似方法来求取这两个期望,从而获得优化函数的梯度。

步骤2:目标分类层训练。目标识别是一个多分类问题,根据神经网络的连接特点, 在特征预训练多层模型基础上添加一个分类层,用于多种目标的分类。具体方法是:

在多层网络的最上层添加一个全连接网络,将输出特征作为该分类层的输入,同 时将目标的类别数量作为分类层输出,根据全连接网络的特点,本专利引入多分类中的多 类逻辑斯谛回归(multi-nominallogisticregression)模型,其定义如下:

Pj=ef(xi)Σkef(xk)---(10)

其中f(xi)=wijxi+bj,模型的输出是一个n维向量,n为目标的类别数目,向量的每 个元素表示待测影像被分为相应类别的概率,将输入图像送入输入层,经过网络传播,得到 的概率最大的目标类别即为待测图像的类别。

步骤3:深度神经网络有监督微调。这一步中,本方法将利用已标注数据进行网络 的参数调整,通过将待测数据通过网络的前向传播得到待测数据的预测值,通过预测值与 标注的真实值之间的差值,利用本专利发明的一种基于稀疏约束的后向传播(back- propagation)算法得到网络模型对于参数的梯度,随后利用梯度下降法等最优化方法,即 可得到一个最优的模型。具体方法是:

(1)将待测数据输入网络,通过前向传播得到预测值,并计算预测值与标注真实值 得差值,本专利发明的差值函数为:

J(W,b)=12||hw,b(x)-y||2---(11)

其中hw,b(x)为网络预测值,y为标注值。

(2)计算优化目标函数对于参数的梯度值,本专利发明的基于稀疏约束的目标函 数为:

L=J(W,b)+βΣjKL(ρ||ρ^j)---(12)

右边第二项为稀疏惩罚项,其计算方法如下:

KL(ρ||ρ^j)=Σj(ρlogρρ^j+(1-ρ)log1-ρ1-ρ^j)---(13)

其中,为隐藏节点的平均活跃度,若平均活跃较小,则每个隐节点为1的概率较 低,从而使得隐藏层节点同时只有很少一部分激活,从而得到稀疏的隐节点。这里使ρ取一 个较小值(如0.05),则上式可以在优化过程中使接近这个值,从而达到隐节点稀疏的目 的,平均激活度的计算方法如下:

ρ^j=1mΣiaj(x(i))---(14)

其中,aj(xi)=wijxi+bj,为了计算目标函数对于参数的梯度值,模型首先计算每个 隐藏层的输出残差,如下式:

σik=((Σjwijσjk+1)+β(-ρρ^j+1-ρ1-ρ^j))f(xi)---(15)

通过隐藏层输出残差可以计算出目标函数对于参数的梯度值:

wijkJ(W,b)=ajkσik+1bikJ(W,b)=σik+1---(16)

(3)利用梯度下降算法进行网络参数优化,计算方法如下:

wijk=wijk-wijkJ(W,b)bik=bik-bikJ(W,b)---(17)

经过多次迭代计算就可以得到最优的网络模型。

步骤4:利用上步最优化的深度网络模型,将待测图像输入模型的输入层。

步骤5:通过神经网络的前向传播计算待测影像的分类输出结果,根据多类逻辑斯 谛回归的输出向量,最终识别目标类型。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详 细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡 在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保 护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号