首页> 中国专利> 一种基于视觉注意力的鼠患检测方法及装置

一种基于视觉注意力的鼠患检测方法及装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开一种基于视觉注意力的鼠患检测方法及装置，首先对包含老鼠在内的视频进行图像帧采集，组成图像数据集；然后对图像数据集包含老鼠在内的子区域进行人工分割与标注，作为后续训练用标注集；构建基于ResNet50基础网络和注意力模块CBAM的视觉注意力残差检测网络；根据前述标注集对视觉注意力残差检测模型进行训练以获取检测训练模型；根据巡检机器人所附相机获取各视觉区域内的视频序列，根据前述训练的检测模型进行目标的检测。本发明通过在残差网络的各个瓶颈残差模块依次增加注意力模块，提升了大型环境下小目标的检测精度，提高了大型机房室内环境下鼠患的检测的准确率。

著录项

公开/公告号CN114882230A

专利类型发明专利
公开/公告日2022-08-09

原文格式PDF
申请/专利权人山东新一代信息产业技术研究院有限公司;
展开▼

申请/专利号CN202210440773.6
发明设计人南国;高明;高岩;王雯哲;郝虹;尹青山;王建华;
展开▼

申请日2022-04-26
分类号G06V10/30(2022.01);G06V20/40(2022.01);G06V10/26(2022.01);G06V10/82(2022.01);G06N3/04(2006.01);G06N3/08(2006.01);
代理机构济南泉城专利商标事务所 37218;
代理人李桂存
地址 250013 山东省济南市高新区港兴三路北段未来创业广场3号楼11-12层
入库时间 2023-06-19 16:19:08

法律信息

法律状态公告日

法律状态信息

法律状态
2022-08-26

实质审查的生效 IPC(主分类):G06V10/30 专利申请号:2022104407736 申请日:20220426

实质审查的生效
2022-08-09

公开

发明专利申请公布

说明书

技术领域

本发明涉及室内环境下面向目标检测的视觉感知领域，具体地说是一种基于视觉注意力机制的大型机房内部老鼠出现的检测方法和装置。

背景技术

在大型机房中，需要24小时不间断的对室内各个角落进行监控，这其中就包括了对于可能引起鼠患发生状况的监控。鼠患检测的难点在于待测目标为大环境下的小目标，极易发生漏检。

同时，本项任务是面向一个具体的室内环境，有其特定的背景特征，具体而言，在大型机房室内环境下，相机所拍摄图像背景，包括地面瓷砖、服务器机柜组、空调机组、电气柜组等，多为规则的几何形状物体。而老鼠本身则具有不规则形状的轮廓。

发明内容

为了提高大型机房室内环境下鼠患的检测的准确率，本发明提供一种基于视觉注意力的鼠患检测方法及装置。

为了解决所述技术问题，本发明采用的及技术方案是：一种基于视觉注意力的鼠患检测方法，包括以下步骤：

S01）、数据集的构建和图像的去噪声处理，获取包含老鼠在内的视频，设置采样间隔，依次对视频序列进行帧图像的采集，并以此组帧图像组成图像数据集，对图像数据集进行去噪声处理；

S02）、目标物体的分割提取与标注，对步骤S01）得到的图像数据集进行目标子区域的分割与提取，所述目标子区域是指包含老鼠在内的区域，组成标注数据集；

S03）、视觉注意力残差检测网络的构建，选取ResNet50残差网络作为基础网络，在基础网络上选择增加视觉注意力模块CBAM模块，从而构成视觉注意力残差检测网络；

S04）、将步骤S02）所述标注数据集输入视觉注意力残差检测网络进行训练，获取训练模型；

S05）、利用训练好的网络模型，对图像数据集进行老鼠的检测以及基于巡检机器人拍摄的图像进行老鼠目标的检测。

进一步的，步骤S01）中，对图像数据集的去噪声处理包括矢量中值滤波与同态滤波。

进一步的，步骤S02）中，对图像数据集进行标注时，采用四个边界包括n个像素余量的方式，n∈(5,10)。

进一步的，步骤S03）中，ResNet50网络由多个瓶颈残差模块叠加而成，为了更有效的提升检测精度，在ResNet50的每一个瓶颈残差模块以及网络最后一层分别依次增加通道注意力模块和空间注意力模块，通道注意力模块是对输入特征图的空间尺度进行压缩处理，并同时进行平均池化和最大池化操作，输入多层感知机，然后进行元素求和，并经过sigmoid激活函数运算，生成通道注意力特征图；空间注意力模块首先应用平均池化和最大池化，通过组合生成有效的特征图，使模型更加注意到特征图的有效信息区域

进一步的，步骤S03）构建的视觉注意力残差检测网络结构组成依次为：卷积层、通道注意力模块、空间注意力模块、ReLU激活函数。

本发明还公开了一种基于视觉注意力的鼠患检测装置，包括视频帧图像获取模块、目标提取与标注模块、残差检测网络构建模块和目标检测模块，视频帧图像基于巡检机器人获取包含老鼠在内的视频，设置采样间隔，依次对视频序列进行帧图像的采集，并以此组帧图像组成图像数据集，对图像数据集进行去噪声处理；目标提取与标注模块对视频帧图像获取模块提取的图像数据集进行目标子区域的分割与提取，所述目标子区域是指包含老鼠在内的区域，组成标注数据集；残差检测网络构建模块以ResNet50残差网络作为基础网络，在基础网络上选择增加视觉注意力模块CBAM模块，从而构成视觉注意力残差检测网络；标注数据集输入视觉注意力残差检测网络进行训练，训练好的模型就是目标检测模块，目标检测模块对图像数据集进行老鼠的检测，以及进行实际环境下目标的实时检测。

进一步的，视频帧图像获取模块对图像数据集的去噪声处理包括矢量中值滤波与同态滤波。

进一步的，目标提取与标注模块对图像数据集进行标注时，采用四个边界包括n个像素余量的方式，n∈(5,10)。

进一步的，视觉注意力残差检测网络中的ResNet50网络由多个瓶颈残差模块叠加而成，为了更有效的提升检测精度，在ResNet50的每一个瓶颈残差模块以及网络最后一层分别依次增加通道注意力模块和空间注意力模块，通道注意力模块是对输入特征图的空间尺度进行压缩处理，并同时进行平均池化和最大池化操作，输入多层感知机，然后进行元素求和，并经过sigmoid激活函数运算，生成通道注意力特征图；空间注意力模块首先应用平均池化和最大池化，通过组合生成有效的特征图，使模型更加注意到特征图的有效信息区域。

进一步的，残差检测网络构建模块构建的视觉注意力残差检测网络结构组成依次为：卷积层、通道注意力模块、空间注意力模块、ReLU激活函数。

本发明的有益效果：本发明在残差网络的各个瓶颈残差模块依次增加注意力模块，提升了大型环境下小目标的检测精度，增加了注意力机制模块的神经网络可以有效的提升目标的检测精度。准确率、检测时间等诸项指标中，本方法将鼠患检测的准确率置于优先考虑的地位，从而提高鼠患检测的准确率。

附图说明

图1为实施例1所述方法的流程图；

图2为实施例2所述装置的结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

实施例1

本实施例公开一种基于视觉注意力的鼠患检测方法，本方法首先获取数据集，对包含老鼠在内的视频数据集的采集，视频环境与机房环境相同或相近似，组成图像数据集；对数据集包含老鼠在内子区域进行人工分割与标注，作为后续训练用标注集；基于ResNet50基础网络和注意力模块CBAM的视觉注意力残差检测网络的构建；根据前述标注集对视觉注意力残差检测模型进行训练以获取检测训练模型；根据巡检机器人所附相机获取各视觉区域内的视频序列，根据前述训练的检测模型进行目标的检测。

如附图1所示方法流程为：

S01）、数据集的构建和图像去噪增强处理。

获取视频，设置采样间隔，依次对视频序列进行帧图像的采集，并以此组帧图像组成图像数据集，后续各步骤基于此图像集以此进行。并依次进行矢量中值滤波与同态滤波，以消除噪声和增强图像的对比度。用于后续的图像各步骤处理中。

S02）、目标区域的分割与标注。

对包含目标物体老鼠在内的子区域的人工分割与提取，组成标注数据集。

在标注的时候并不是用严格紧致包围的矩形框，而是四个边界保留n (n∈(5,10))个像素的余量。

S03）、视觉注意力残差检测网络的构建。

在本方法中，对检测模型的构建选取ResNet50残差网络作为基础网络，并对其进行改造。ResNet残差网络主要为了应对深层网络的加深而引起训练集准确率下降即退化问题而提出的。ResNet残差网络利用batch normalization(BN)较好的解决了由于网络加深而引起的梯度消失和梯度爆炸问题，并利用残差结构解决了退化问题，从而提升了网络模型的分类能力。

同时为了提升网络对感兴趣区域的表征能力，本项目在基础网络上选择增加视觉注意力模块。具体而言，在前述ResNet50中增加CBAM模块。ResNet50是由多个瓶颈残差模块叠加而成，为了更有效的提升检测精度，具体实施为同时在ResNet50的每一个瓶颈残差模块以及在网络最后一层分别依次增加通道注意力模块和空间注意力模块，用以推断注意力图。

经过上述集成，一个完整视觉注意力残差检测模块的结构组成依次为：卷积层、通道注意力模块、空间注意力模块、ReLU激活函数。

通道注意力模块是对输入特征图的空间尺度进行压缩处理，并同时进行平均池化和最大池化操作，输入多层感知机，然后进行元素求和，并经过sigmoid激活函数运算，生成通道注意力特征图。空间注意力模块首先应用平均池化和最大池化，通过组合生成有效的特征图，使模型更加注意到特征图的有效信息区域。

S04）、视觉注意力残差检测模型的训练。

前述所标注之数据集，输入已增加视觉注意力机制的ResNet50检测网络进行训练，获取训练模型。

S05）、基于视觉注意力残差检测网络的实际环境目标的检测

根据巡检机器人所附相机获取各视觉区域内的视频以及对应的序列帧图像，利用前述训练好的检测网络模型，对图像数据集进行老鼠的检测，以及进行实际环境下目标的实时检测。

实施例2

本实施例公开一种基于视觉注意力的鼠患检测装置，如图2所示，包括视频帧图像获取模块、目标提取与标注模块、残差检测网络构建模块和目标检测模块，视频帧图像基于巡检机器人获取包含老鼠在内的视频，视频环境与机房环境相同或相近似，设置采样间隔，依次对视频序列进行帧图像的采集，并以此组帧图像组成图像数据集，对图像数据集进行去噪声处理；目标提取与标注模块对视频帧图像获取模块提取的图像数据集进行目标子区域的分割与提取，所述目标子区域是指包含老鼠在内的区域，组成标注数据集；残差检测网络构建模块以ResNet50残差网络作为基础网络，在基础网络上选择增加视觉注意力模块CBAM模块，从而构成视觉注意力残差检测网络；标注数据集输入视觉注意力残差检测网络进行训练，训练好的模型就是目标检测模块，目标检测模块对图像数据集进行老鼠的检测，以及进行实际环境下目标的实时检测。

本实施例中，视频帧图像获取模块对图像数据集的去噪声处理包括矢量中值滤波与同态滤波。目标提取与标注模块对图像数据集进行标注时，并不是用严格紧致包围的矩形框，而是采用四个边界包括n个像素的余量的方式，n∈(5,10)。

本实施例中，残差检测网络构建模块构建的视觉注意力残差检测网络结构组成依次为：卷积层、通道注意力模块、空间注意力模块、ReLU激活函数。视觉注意力残差检测网络中的ResNet50网络由多个瓶颈残差模块叠加而成，为了更有效的提升检测精度，在ResNet50的每一个瓶颈残差模块以及网络最后一层分别依次增加通道注意力模块和空间注意力模块，通道注意力模块是对输入特征图的空间尺度进行压缩处理，并同时进行平均池化和最大池化操作，输入多层感知机，然后进行元素求和，并经过sigmoid激活函数运算，生成通道注意力特征图。空间注意力模块首先应用平均池化和最大池化，通过组合生成有效的特征图，使模型更加注意到特征图的有效信息区域。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明做出的改进和替换，属于本发明的保护范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于视觉注意力的鼠患检测方法及装置 [P] . 中国专利： CN114882230A . 2022-08-09
2. 融合视觉注意力基于对比度的显著性检测方法及装置 [P] . 中国专利： CN110251076B . 2021.10.22
3. Visual attention detector and visual attention detection method [P] . 美国专利： US9904868B2 . 2018-02-27

机译：视觉注意力检测器和视觉注意力检测方法
4. Method for detecting vision attention to assembly area of e.g. infotainment device of motor vehicle, involves outputting signal via interface when viewing direction of occupant is directed to area so as to detect vision attention to area [P] . 德国专利： DE102009046451A1 . 2011-05-12

机译：用于检测视觉对装配区域的注意力的方法机动车辆的信息娱乐装置，涉及当乘员的视线指向区域时通过接口输出信号，以检测视觉对区域的关注
5. Image object detection based on visual attention and reduced-scale search based regions of interest [P] . 英国专利： GB2483787A . 2012-03-21

机译：基于视觉注意力和基于兴趣区域的缩小搜索的图像对象检测