Discriminative Probing and Tuning for Text-to-Image Generation | allainews.com

March 8, 2024, 5:45 a.m. | Leigang Qu, Wenjie Wang, Yongqi Li, Hanwang Zhang, Liqiang Nie, Tat-Seng Chua

cs.CV updates on arXiv.org arxiv.org

arXiv:2403.04321v1 Announce Type: new
Abstract: Despite advancements in text-to-image generation (T2I), prior methods often face text-image misalignment problems such as relation confusion in generated images. Existing solutions involve cross-attention manipulation for better compositional understanding or integrating large language models for improved layout planning. However, the inherent alignment capabilities of T2I models are still inadequate. By reviewing the link between generative and discriminative modeling, we posit that T2I models' discriminative abilities may reflect their text-image alignment proficiency during generation. In this …

abstract alignment arxiv attention capabilities cs.ai cs.cl cs.cv cs.mm face generated however image image generation images language language models large language large language models manipulation planning prior solutions text text-image text-to-image type understanding

More from arxiv.org / cs.CV updates on arXiv.org

PCLMix: Weakly Supervised Medical Image Segmentation via Pixel-Level Contrastive Learning and Dynamic Mix Augmentation 18 hours ago | arxiv.org

arxiv augmentation cs.cv dynamic +7

Retrieval-Augmented Egocentric Video Captioning 18 hours ago | arxiv.org

abstract arxiv benefit captioning +20

Geo-Localization Based on Dynamically Weighted Factor-Graph 18 hours ago | arxiv.org

abstract aerial arxiv cs.cv +12

Mesh Neural Cellular Automata 18 hours ago | arxiv.org

arxiv cellular cs.ai cs.cv +4

Mirror-Aware Neural Humans 18 hours ago | arxiv.org

abstract affordable alternative arxiv +14

MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image Editing 18 hours ago | arxiv.org

arxiv cs.ai cs.cl cs.cv +5

A Foundation Model for Brain Lesion Segmentation with Mixture of Modality Experts 18 hours ago | arxiv.org

abstract arxiv brain complexity +13

MrRegNet: Multi-resolution Mask Guided Convolutional Neural Network for Medical Image Registration with Large Deformations 18 hours ago | arxiv.org

arxiv convolutional convolutional neural network cs.cv +8

Histopathology Foundation Models Enable Accurate Ovarian Cancer Subtype Classification 18 hours ago | arxiv.org

abstract artificial artificial intelligence arxiv +13

Software Engineer for AI Training Data (School Specific)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Python)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Tier 2)

@ G2i Inc | Remote

View on ai-jobs.net

Data Engineer

@ Lemon.io | Remote: Europe, LATAM, Canada, UK, Asia, Oceania

View on ai-jobs.net

Artificial Intelligence – Bioinformatic Expert

@ University of Texas Medical Branch | Galveston, TX

View on ai-jobs.net

Lead Developer (AI)

@ Cere Network | San Francisco, US

View on ai-jobs.net