弱标注环境下基于多标签深度学习的加速图像标注

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着数字信息技术不断融人人们生活，各种图像的数量增长迅猛，如何对这些海量的图像进行有效的管理并从中挖掘出对用户有用的信息成为亟需解决的问题。图像的多标签语义标注用自然语言来描述图像，将对图像的检索转换为人类易于理解的文本检索，是解决以上问题的有效办法。因此，图像的多标签语义标注越来越受到重视。
　　当前多标签图像标注主要遇到两个问题。一个来源于算法层面:基于传统机器学习的算法特征提取十分复杂，需要有经验的人进行精心的特征选取;而基于多标签深度学习的图像标注虽然效果好且不需要人工进行特征提取和挑选，但是当前的深度学习模型往往由于计算量巨大导致CPU模式下标注速度过慢而实用性较差;一个来源于数据层面:真实环境中训练数据集广泛存在语义标签集不完整问题，而且低频语义标签和高频语义标签的图像数据分布十分不均衡，这种数据集称为弱标注数据集，这种数据集的标签不完整和语义分布失衡会严重的影响模型的学习效果。
　　针对上述问题，本文提出了弱标注环境下基于多标签深度学习的图像加速标注方法。论文的主要工作如下:
　　(1)针对深度卷积神经网络VGG-16速度过慢的问题，构建了一种新的深度卷积神经网络:通过修改模型卷积核的步长等方法，减小每层的输出维度，构建出一个参数计算量约为网络VGG-16近1/7的深度卷积神经网络New Net;然后再对本文提出的网络的相应卷积层进行奇异值分解(SVD)，并构建出参数计算量约为网络VGG-16近1/10的分解网络New_SVD_Net。本文提出的分解网络在测试集上的平均准确率相比于网络VGG-16降低2.5％，但是在CPU模式下处理单张图片的速度却加快了近6倍，大大提升了深度模型的实用性。
　　(2)针对弱标注数据集环境的训练数据集，设计了针对弱标注数据集的数据迭代优化算法框架:通过补充低频语义标签的单标签图像数据的方法来提升深度卷积神经网络对低频语义标签的识别精度;通过得到的最终模型对原始训练集进行预测标注，并与原始标签集进行合并，其中预测标注步骤本文使用特征融合和KNN分类器替代softmax分类器进行了优化。经实验证明，在相关数据集上，迭代优化后的训练数据集标签个数相比原始标签集增加近7％，经网络VGG-16和New Net进行学习至收敛后，在同样测试集上的平均准确率提升约1.2％。
　　论文工作已应用于腾讯优图开放平台图像识别等商业图像识别服务，获得良好的效果。

著录项

作者
温翔;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科控制工程
授予学位硕士
导师姓名赵林海;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
弱标注环境; 多标签深度学习; 数据迭代; 图像加速标注;

相似文献

中文文献
外文文献
专利

1. 弱标签环境下基于语义邻域学习的图像标注 [J] . 田枫 ,沈旭昆 . 计算机研究与发展 . 2014,第008期
2. 基于深度学习中间层卷积特征的图像标注 [J] . 于宁 ,宋海玉 ,孙东洋 . 图学学报 . 2019,第005期
3. 基于深度学习中间层卷积特征的图像标注 [J] . 于宁 ,宋海玉 ,孙东洋 . 图学学报 . 2019,第005期
4. 基于深度学习的结构化图像标注研究 [J] . 姚义 ,王诗珂 ,陈希豪 . 电脑知识与技术 . 2019,第033期
5. 基于深度学习的自动图像标注研究与实现 [J] . 何炳金 ,宋海玉 ,孙东洋 . 中国高新技术企业 . 2017,第003期
6. 一种基于弱标签的三维模型语义自动标注方法 [C] . TIAN Feng ,田枫 ,SHENXu-kun . 第十二届中国虚拟现实大会 . 2012
7. 弱标签标注环境下的分段式语义标注方法研究 [A] . 安立桐 . 2020

弱标注环境下基于多标签深度学习的加速图像标注

目录

摘要

著录项

相似文献

相关主题

期刊订阅