Tuning-Free Image Customization with Image and Text Guidance | allainews.com

March 20, 2024, 4:45 a.m. | Pengzhi Li, Qiang Nie, Ying Chen, Xi Jiang, Kai Wu, Yuhuan Lin, Yong Liu, Jinlong Peng, Chengjie Wang, Feng Zheng

cs.CV updates on arXiv.org arxiv.org

arXiv:2403.12658v1 Announce Type: new
Abstract: Despite significant advancements in image customization with diffusion models, current methods still have several limitations: 1) unintended changes in non-target areas when regenerating the entire image; 2) guidance solely by a reference image or text descriptions; and 3) time-consuming fine-tuning, which limits their practical application. In response, we introduce a tuning-free framework for simultaneous text-image-guided image customization, enabling precise editing of specific image regions within seconds. Our approach preserves the semantic features of the reference …

abstract application arxiv cs.cv current customization diffusion diffusion models fine-tuning free guidance image limitations practical reference text type

More from arxiv.org / cs.CV updates on arXiv.org

Demonstration of an Adversarial Attack Against a Multimodal Vision Language Model for Pathology Imaging 7 hours ago | arxiv.org

adversarial arxiv cs.cv eess.iv +9

Hundred-Kilobyte Lookup Tables for Efficient Single-Image Super-Resolution 7 hours ago | arxiv.org

arxiv cs.cv eess.iv image +3

Swift Parameter-free Attention Network for Efficient Super-Resolution 7 hours ago | arxiv.org

arxiv attention cs.cv eess.iv +5

Generative Multimodal Models are In-Context Learners 7 hours ago | arxiv.org

abstract arxiv capabilities context +16

HeadArtist: Text-conditioned 3D Head Generation with Self Score Distillation 7 hours ago | arxiv.org

abstract arxiv call controlnet +11

WavePlanes: A compact Wavelet representation for Dynamic Neural Radiance Fields 7 hours ago | arxiv.org

arxiv compact cs.cv cs.gr +6

A Survey of Emerging Applications of Diffusion Probabilistic Models in MRI 7 hours ago | arxiv.org

abstract applications arxiv computational +11

Utilizing dataset affinity prediction in object detection to assess training data 7 hours ago | arxiv.org

abstract advantages arxiv bias +16

Integrating View Conditions for Image Synthesis 7 hours ago | arxiv.org

abstract arxiv challenge control +17

Artificial Intelligence – Bioinformatic Expert

@ University of Texas Medical Branch | Galveston, TX

View on ai-jobs.net

Lead Developer (AI)

@ Cere Network | San Francisco, US

View on ai-jobs.net

Research Engineer

@ Allora Labs | Remote

View on ai-jobs.net

Ecosystem Manager

@ Allora Labs | Remote

View on ai-jobs.net

Founding AI Engineer, Agents

@ Occam AI | New York

View on ai-jobs.net

AI Engineer Intern, Agents

@ Occam AI | US

View on ai-jobs.net