首页> 中文学位 >基于循环神经网络的交互式抠图方法研究
【6h】

基于循环神经网络的交互式抠图方法研究

代理获取

目录

声明

1 绪论

1.1 研究课题的背景及意义

1.2 国内外研究现状

1.2.1 数据集的收集与介绍

1.2.2 基于先验知识的数字抠图方法

1.2.3 基于学习的数字抠图方法

1.3 本文的主要研究内容及组织结构

2 人工神经网络在计算机视觉领域的应用理论与实践

2.1 人工神经网络在计算机视觉领域的应用概述

2.2 利用人工神经网络检测数字图像中的显著性目标

2.3 利用人工神经网络进行图像语义分割

2.4 利用人工神经网络处理视频帧间时空关联信息

2.5 本章小结

3 基于循环神经网络的交互式抠图方法

3.1 现有方法分析及问题的提出

3.2 基于循环神经网络的交互式抠图模型

3.2.1 模型结构

3.2.2 模型的内部分析

3.3 实验结果

3.3.1 与四个基准方法的比较

3.3.2 与三部分割图的比较

3.3.3 两种数字抠图模式分别的展示

3.4 本章小结

4 基于卷积神经网络的数字图像特征提取及前后景预测方法

4.1 问题描述及理论分析

4.1.1 问题描述

4.1.2 理论分析

4.2 基于稠密连接的数字图像前后景预测模型

4.2.1 神经网络结构

4.2.2 神经网络超参数设定及训练细节

4.3 模型预测结果展示及分析

4.4 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

数字图像的抠图问题旨在将数字图像中的前景物体与背景进行精确地分割。对该问题的求解一直是计算机视觉领域中的研究热点;同时,数字图像抠图技术也在数字图像处理领域中扮演着基础且关键的角色。在当下的数字媒体时代,电影电视制作、动画制作、网络直播等新兴技术的蓬勃发展、新生应用场景的不断丰富为数字图像抠图技术带来了诸多新的挑战。与此同时,深度学习技术尤其是人工神经网络技术的出现及完善,也为数字图像抠图问题的求解提供了新的工具和新的思路。为此,本文将围绕数字图像抠图问题,利用人工神经网络工具开展相关探索与研究。 首先,本文将介绍一个基于循环神经网络处理数字图像抠图问题的系统框架。该框架依靠对原图的精确编码,采用主动迭代式的方法向用户推荐富有信息量的关键区域,用户仅需依据推荐区域给出前景或背景的二值标签,本文所提出的系统框架将自动传播这些标签并生成最终的数字图像抠图结果。本文提出的方法及框架一方面极大地减少了数字图像抠图过程中所需的人工标注量,另一方面也取得了与当前主流先进方法相媲美的高质量结果。 随后,本文提出利用稠密连接的卷积神经网络为单张图片预测出一个富含语义信息的三部分割图。该分割过程将输入图片分为确定的前景、确定的背景和待求解区域三个部分。相比于传统的基于显著性检测的预测方法,预测出的三部分割图拥有更为准确的前后景信息,尽量准确地压缩待求解区域面积,能够为后续的基于三部分割图的数字图像抠图方法提供更为精准的引导。 最后,本文将对提出的数字图像抠图方法及系统框架做出总结,分析该方案存在的局限性,并对未来的研究方向进行展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号