Multilayer feature descriptors fusion CNN models for fine-grained visual recognition

Hou Yong; Luo Hangzai; Zhao Wanqing; Zhang Xiang; Wang Jun; Peng Jinye

首页> 外文期刊>Computer Animation and Virtual Worlds >Multilayer feature descriptors fusion CNN models for fine-grained visual recognition

【24h】

Multilayer feature descriptors fusion CNN models for fine-grained visual recognition

机译：多层特征描述符融合CNN模型以实现细粒度的视觉识别

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Fine-grained image classification is a challenging topic in the field of computer vision. General models based on first-order local features cannot achieve acceptable performance because the features are not so efficient in capturing fine-grained difference. A bilinear convolutional neural network (CNN) model exhibits that a second-order statistical feature is more efficient in capturing fine-grained difference than a first-order local feature. However, this framework only considers the extraction of a second-order feature descriptor, using a single convolutional layer. The potential effective classification features of other convolutional layers are ignored, resulting in loss of recognition accuracy. In this paper, a multilayer feature descriptors fusion CNN model is proposed. It fully considers the second-order feature descriptors and the first-order local feature descriptor generated by different layers. Experimental verification was carried out on fine-grained classification benchmark data sets, CUB-200-2011, Stanford Cars, and FGVC-aircraft. Compared with the bilinear CNN model, the proposed method has improved accuracy by 0.8%, 1.1%, and 5.5%. Compared with the compact bilinear pooling model, there is an accuracy increase of 0.64%, 1.63%, and 1.45%, respectively. In addition, the proposed model effectively uses multiple 1x1 convolution kernels to reduce dimension. The experimental results show that the multilayer low-dimensional second-order feature descriptors fusion model has comparable recognition accuracy of the original model.

机译：细粒度的图像分类是计算机视觉领域中一个具有挑战性的主题。基于一阶局部特征的通用模型无法实现可接受的性能，因为这些特征在捕获细粒度差异方面效率不高。双线性卷积神经网络（CNN）模型显示，与一阶局部特征相比，二阶统计特征在捕获细粒度差异方面更有效。但是，此框架仅考虑使用单个卷积层提取二阶特征描述符。其他卷积层的潜在有效分类特征将被忽略，从而导致识别精度下降。本文提出了一种多层特征描述符融合的CNN模型。它充分考虑了由不同层生成的二阶特征描述符和一阶局部特征描述符。在细粒度的分类基准数据集，CUB-200-2011，斯坦福汽车和FGVC飞机上进行了实验验证。与双线性CNN模型相比，该方法的准确性提高了0.8％，1.1％和5.5％。与紧凑型双线性池模型相比，精度分别提高了0.64％，1.63％和1.45％。此外，所提出的模型有效地使用了多个1x1卷积核来减小维数。实验结果表明，多层低维二阶特征描述符融合模型具有与原始模型相当的识别精度。

著录项

来源
《Computer Animation and Virtual Worlds》 |2019年第4期|e1897.1-e1897.9|共9页
作者
Hou Yong; Luo Hangzai; Zhao Wanqing; Zhang Xiang; Wang Jun; Peng Jinye;
展开▼
作者单位

Northwest Univ, Sch Informat Sci & Technol, Xian 710127, Shaanxi, Peoples R China;

Northwest Univ, Sch Informat Sci & Technol, Xian 710127, Shaanxi, Peoples R China;

Northwest Univ, Sch Informat Sci & Technol, Xian 710127, Shaanxi, Peoples R China;

Northwest Univ, Sch Informat Sci & Technol, Xian 710127, Shaanxi, Peoples R China;

Northwest Univ, Sch Informat Sci & Technol, Xian 710127, Shaanxi, Peoples R China;

Northwest Univ, Sch Informat Sci & Technol, Xian 710127, Shaanxi, Peoples R China;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
convolutional neural network; deep learning; dimensionality reduction; fine-grained image classification; multilayer feature descriptors;

机译：卷积神经网络;深入学习;减少维度;细粒度的图像分类;多层特征描述符;

相似文献

外文文献
中文文献
专利

1. FEC: A Feature Fusion Framework for SAR Target Recognition Based on Electromagnetic Scattering Features and Deep CNN Features [J] . Zhang Jinsong, Xing Mengdao, Xie Yiyuan IEEE Transactions on Geoscience and Remote Sensing . 2021,第3期

机译：FEC：基于电磁散射特征和深层CNN特征的SAR目标识别特征融合框架
2. Region-sequence based six-stream CNN features for general and fine-grained human action recognition in videos [J] . Ma Miao, Marturi Naresh, Li Yibin, Pattern Recognition: The Journal of the Pattern Recognition Society . 2018,第期

机译：基于区域序列的六流CNN功能，用于视频中的一般和细粒度的人类行动识别
3. CNN-Based Multilayer Spatial–Spectral Feature Fusion and Sample Augmentation With Local and Nonlocal Constraints for Hyperspectral Image Classification [J] . Feng Jie, Chen Jiantong, Liu Liguo, Selected Topics in Applied Earth Observations and Remote Sensing, IEEE Journal of . 2019,第4期

机译：基于CNN的多层空间光谱特征融合和具有局部和非局部约束的样本增强用于高光谱图像分类
4. FF-CMnet: A CNN-Based Model for Fine-Grained Classification of Car Models Based on Feature Fusion [C] . Ye Yu, Qiang Jin, Chang Wen Chen IEEE International Conference on Multimedia and Expo . 2018

机译：FF-CMnet：基于CNN的基于特征融合的汽车模型细粒度分类
5. Pattern recognition and feature extraction using lidar-derived elevation models in GIS: A comparison between visualization techniques and automated methods for identifying prehistoric ditch-fortified sites in North Dakota [D] . Radermacher, Matthew Jeffery. 2016

机译：使用GIS中基于激光雷达的高程模型进行模式识别和特征提取：可视化技术与识别北达科他州史前沟壑加固地点的自动化方法之间的比较
6. Tensor-Based Emotional Category Classification via Visual Attention-Based Heterogeneous CNN Feature Fusion [O] . Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, 2020

机译：通过基于视觉注意的异构CNN特征融合的基于张量的情感类别分类
7. Pattern Recognition of Partial Discharge Based on VMD-CWD Spectrum and Optimized CNN With Cross-Layer Feature Fusion [O] . Angran Gao, Yongli Zhu, Weihao Cai, 2020

机译：基于VMD-CWD谱的局部放电的模式识别，并利用交叉层特征融合优化CNN

Multilayer feature descriptors fusion CNN models for fine-grained visual recognition

摘要

著录项

相似文献

相关主题

期刊订阅