一种用于人群计数的多尺度深度VLAD网络

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

最近几年计算机技术突飞猛进，特别是人工智能在计算机视觉相关领域的进展，使得智能监控在智慧城市建设中显得尤为重要。但是传统的视频监控技术已经不能跟上人们生活和社会发展的要求，以人工智能算法为基础进行图像分析的智能视频监控相关方法技术逐渐发展为监控领域的主要手段。智能监控系统当中重要的人群计数问题，成为了计算机视觉智能视频监控课题中最热门的研究问题之一。　　人群计数是指对公共场所摄像头采集的视频流或者静态图像中的行人通过算法分析得到人群总数的过程。由于公共场合的摄像头规格各异，行人背景中的场景复杂变化，这些都给人群数量的估计带来了难度。与传统的方法不同，卷积神经网络(Convolutional Neural Network，CNN)的处理方式则可以不用再对人群图像进行预先的场景分割和人工标定特征提取，而是自动学习和提取关键人群特征，解决了传统的人群人数估计方法中人工选择特征准确率低、不同环境条件下适应性差等问题。但现有的大多数基于CNN的人群计数方法由于训练数据的匮乏，都采用网络深度较浅的结构，因此特征提取能力不够，并且对人群特征的使用不够合理，导致在碰到图像分辨率大小不一、尺度及视角多变时准确率和鲁棒性都下降。　　为了解决上述问题，本文提出了一种多尺度深度NetVLAD人群计数模型。采用比现有大多数CNN人群计数模型层数更深的网络结构，获得更强的人群图像特征提取能力，将最终学习到的特征图采用VLAD（局部聚合描述符向量）编码方式来处理，使得对人群图像的遮挡、视角变化等有更强的鲁棒性。接着将CNN中不同阶段的卷积特征相融合，使得低级特征作为高级特征的补充信息，更好的抓住一些遗漏的特征点，进行人数估计是采用了应用人群密度图这种间接的方式。本文提出一种新的数据扩充方法，能够对深的CNN人群模型进行充分的训练，实时随机生成数量更多，差异性更强的训练样本，能有效的避免过拟合的发生。本文的方法是端到端的、可训练的，并且在尺度变化、视角变化和部分遮挡等拥挤人群场景下具有较高的准确性和鲁棒性。在UCF CC_50数据集，Shanghaitech数据集以及WorldExpo'10数据集这三个标准数据集上进行了实验，实验结果表明本文人群计数模型在准确率和鲁棒性上的优越性。

著录项

作者
孙一博;
展开▼
作者单位

郑州大学;

展开▼
授予单位郑州大学;
学科计算机科学与技术
授予学位硕士
导师姓名叶阳东,朱真峰;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
智能监控图像,人群计数,卷积神经网络,特征提取,局部聚合描述符向量;

相似文献

中文文献
外文文献
专利

1. 一种基于多尺度融合卷积神经网络的人群计数方法 [J] . 蒋俊 ,龙波 ,高明亮 . 科学技术与工程 . 2021,第001期
2. 基于多尺度目标检测的人群计数深度方法与系统设计 [J] . 贾奇麟 ,段其微 ,徐源 . 黑龙江科技信息 . 2021,第025期
3. 基于多尺度目标检测的人群计数深度方法与系统设计 [J] . 贾奇麟 ,段其微 ,徐源 . 科学技术创新 . 2021,第025期
4. 基于多尺度增强网络的人群计数方法 [J] . 徐涛 ,段仪浓 ,杜佳浩 . 电子与信息学报 . 2021,第006期
5. 多尺度特征融合的对抗神经网络人群计数算法 [J] . 韩萍 ,刘占锋 ,贾云飞 . 中国民航大学学报 . 2021,第001期
6. 一种用于2π多丝正比计数器的放大电路设计及性能测试 [C] . 王志刚 ,邓长明 ,张世让 . 第七届全国核仪器及其应用学术会议暨全国第五届核反应堆用核仪器学术会议 . 2009
7. 面向多尺度人群计数的深度神经网络算法研究 [A] . 曾鑫 . 2020

一种用于人群计数的多尺度深度VLAD网络

目录

摘要

著录项

相似文献

相关主题

期刊订阅