首页> 中文期刊>南京信息工程大学学报 >基于Faster R-CNN的食品图像检索和分类

基于Faster R-CNN的食品图像检索和分类

     

摘要

面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能.%Automatic understanding of food images has various applications in different fields,such as food intake monitor and food calorie estimation.Thus,the research on food related tasks,such as food image retrieval and classification has been one of the hot research topics in the field of multimedia analysis and applications recently.Existing methods mainly extract the visual features from the whole food image for further food analysis.The extracted features are lacking in robustness because of the background interference from the images.In order to solve this problem,we propose a Faster RCNN ( Region-based Convolutional Neural Network ) based food retrieval and classification method.For the solution,we first detect the food candidate regions using Faster R-CNN,and then adopt the CNN network to extract the visual features from the detected food regions.Such extracted features are more discriminative for reducing the background interference.Furthermore,we select the annotated food images from the Visual Genome dataset to fine-tune the Faster R-CNN to guarantee its performance. We conduct the experiment on two datasets:Food-101 with 101 classes and 10641 food images,and Dish-233 with 233 dishes and 49168 images.The extensive evaluation demonstrates the effectiveness of the proposed Faster R-CNN based food visual feature extraction method in food image retrieval and classification.

著录项

  • 来源
    《南京信息工程大学学报》|2017年第6期|635-641|共7页
  • 作者单位

    山东科技大学 数学与系统科学学院,青岛,266590;

    中国科学院计算技术研究所 智能信息处理重点实验室,北京,100190;

    中国科学院计算技术研究所 智能信息处理重点实验室,北京,100190;

    中国科学院计算技术研究所 智能信息处理重点实验室,北京,100190;

    中国科学院大学 人工智能技术学院,北京,100049;

    山东科技大学 数学与系统科学学院,青岛,266590;

    中国科学院计算技术研究所 智能信息处理重点实验室,北京,100190;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP391.41;
  • 关键词

    食品图像; 图像检索; 图像分类; 深度学习; FasterR-CNN; 卷积神经网络;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号