Exploring Explicit Domain Supervision for Latent Space Disentanglement in Unpaired Image-to-Image Translation

Lin Jianxin; Chen Zhibo; Xia Yingce; Liu Sen; Qin Tao; Luo Jiebo

首页> 外文期刊>IEEE Transactions on Pattern Analysis and Machine Intelligence >Exploring Explicit Domain Supervision for Latent Space Disentanglement in Unpaired Image-to-Image Translation

【24h】

Exploring Explicit Domain Supervision for Latent Space Disentanglement in Unpaired Image-to-Image Translation

机译：探索未配对图像到图像翻译中潜在空间解剖学的显式域监管

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Image-to-image translation tasks have been widely investigated with Generative Adversarial Networks (GANs). However, existing approaches are mostly designed in an unsupervised manner, while little attention has been paid to domain information within unpaired data. In this article, we treat domain information as explicit supervision and design an unpaired image-to-image translation framework, Domain-supervised GAN (DosGAN), which takes the first step towards the exploration of explicit domain supervision. In contrast to representing domain characteristics using different generators or domain codes, we pre-train a classification network to explicitly classify the domain of an image. After pre-training, this network is used to extract the domain-specific features of each image. Such features, together with the domain-independent features extracted by another encoder (shared across different domains), are used to generate image in target domain. Extensive experiments on multiple facial attribute translation, multiple identity translation, multiple season translation and conditional edges-to-shoes/handbags demonstrate the effectiveness of our method. In addition, we can transfer the domain-specific feature extractor obtained on the Facescrub dataset with domain supervision information to unseen domains, such as faces in the CelebA dataset. We also succeed in achieving conditional translation with any two images in CelebA, while previous models like StarGAN cannot handle this task.

机译：图像到图像转换任务已被生成的对抗网络（GANS）被广泛调查。但是，现有方法主要以无人监督的方式设计，虽然在未配对数据中的域信息已经支付了很少的关注。在本文中，我们将域名信息视为明确的监督和设计一个未配对的图像到图像翻译框架，域监管甘（DOSGAN），这将迈出探索显式域监管的第一步。与使用不同生成器或域代码的表示域特征相比，我们预先训练分类网络以明确地分类图像的域。在预训练之后，该网络用于提取每个图像的特定域特征。这些特征与由另一个编码器提取的域的独立功能（在不同域中共享）一起用于生成目标域中的图像。关于多个面部属性翻译的大量实验，多重识别转换，多季翻译和条件边缘到鞋/手提包展示了我们方法的有效性。此外，我们可以使用域监控信息传输在Facescrub数据集上获得的域特定的特征提取器，以解密域，例如Celeba数据集中的面部。我们还成功地与Celeba中的任何两个图像实现了条件翻译，而前以前的模型如Stargan则无法处理此任务。

著录项

来源
《IEEE Transactions on Pattern Analysis and Machine Intelligence》 |2021年第4期|1254-1266|共13页
作者
Lin Jianxin; Chen Zhibo; Xia Yingce; Liu Sen; Qin Tao; Luo Jiebo;
展开▼
作者单位

Univ Sci & Technol China Hefei 230026 Anhui Peoples R China;

Univ Sci & Technol China Hefei 230026 Anhui Peoples R China;

Microsoft Res Asia Beijing 100080 Peoples R China;

Univ Sci & Technol China Hefei 230026 Anhui Peoples R China;

Microsoft Res Asia Beijing 100080 Peoples R China;

Univ Rochester Dept Comp Sci Rochester NY 14627 USA;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
Feature extraction; Task analysis; Gallium nitride; Generative adversarial networks; Generators; Data mining; Image synthesis; Image-to-image translation; explicit domain supervision; generative adversarial networks;

机译：特征提取;任务分析;氮化镓;生成的对抗网络;发电机;数据挖掘;图像合成;图像到图像翻译;显式域监管;生成的域名监督;生成的对抗网络;

相似文献

外文文献
中文文献
专利

1. Multi-head mutual-attention CycleGAN for unpaired image-to-image translation [J] . Ji Wei, Guo Jing, Li Yun Image Processing, IET . 2020,第11期

机译：用于未配对的图像到图像转换的多头互连激活
2. Underwater Image Dehazing via Unpaired Image-to-image Translation [J] . International Journal of Control, Automation, and Systems . 2020,第3期

机译：通过未配对的图像到图像翻译水下图像去吸附
3. Implicit pairs for boosting unpaired image-to-image translation [J] . Yiftach Ginger, Dov Danon, Hadar Averbuch-Elor, Visual Informatics . 2020,第4期

机译：隐含成对，用于提升未配对的图像到图像转换
4. Domain Bridge for Unpaired Image-to-Image Translation and Unsupervised Domain Adaptation [C] . Fabio Pizzati, Raoul de Charette, Michela Zaccaria, IEEE Winter Conference on Applications of Computer Vision . 2020

机译：域桥，用于不成对的图像到图像的转换和无监督的域自适应
5. Structured Disentangling Networks for Learning Deformation Invariant Latent Spaces [D] . Koneripalli Seetharam, Kaushik. 2019

机译：用于学习变形不变潜空间的结构化解剖网
6. GD-StarGAN: Multi-domain image-to-image translation in garment design [O] . Yangyun Shen, Runnan Huang, Wenkai Huang 2020

机译：GD-Stargan：服装设计中的多域图像到图像图像转换
7. Unsupervised multi-domain multimodal image-to-image translation with explicit domain-constrained disentanglement [O] . Weihao Xia, Yujiu Yang, Jing-Hao Xue 2020

机译：无监督的多域多模式图像到图像到图像与显式域约束解剖学

Exploring Explicit Domain Supervision for Latent Space Disentanglement in Unpaired Image-to-Image Translation

摘要

著录项

相似文献

相关主题

期刊订阅