Win-Win: Training High-Resolution Vision Transformers from Two Windows | allainews.com

March 25, 2024, 4:45 a.m. | Vincent Leroy, Jerome Revaud, Thomas Lucas, Philippe Weinzaepfel

cs.CV updates on arXiv.org arxiv.org

arXiv:2310.00632v2 Announce Type: replace
Abstract: Transformers have become the standard in state-of-the-art vision architectures, achieving impressive performance on both image-level and dense pixelwise tasks. However, training vision transformers for high-resolution pixelwise tasks has a prohibitive cost. Typical solutions boil down to hierarchical architectures, fast and approximate attention, or training on low-resolution crops. This latter solution does not constrain architectural choices, but it leads to a clear performance drop when testing at resolutions significantly higher than that used for training, thus …

abstract architectures art arxiv attention become cost crops cs.cv hierarchical however image low performance resolution solutions standard state tasks training transformers type vision vision transformers windows

More from arxiv.org / cs.CV updates on arXiv.org

SSL-OTA: Unveiling Backdoor Threats in Self-Supervised Learning for Object Detection 16 hours ago | arxiv.org

abstract adoption arxiv attacks +19

MELEP: A Novel Predictive Measure of Transferability in Multi-Label ECG Diagnosis 16 hours ago | arxiv.org

abstract annotated data arxiv assessment +16

Smartphone region-wise image indoor localization using deep learning for indoor tourist attraction 16 hours ago | arxiv.org

abstract arxiv block concrete +17

LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry 16 hours ago | arxiv.org

abstract arxiv assessment context +15

A Simple Video Segmenter by Tracking Objects Along Axial Trajectories 16 hours ago | arxiv.org

arxiv cs.cv objects replace +4

MobileDiffusion: Instant Text-to-Image Generation on Mobile Devices 16 hours ago | arxiv.org

abstract architecture arxiv cs.cv +21

Exploring Frequency-Inspired Optimization in Transformer for Efficient Single Image Super-Resolution 16 hours ago | arxiv.org

abstract arxiv cs.cv current +15

AViT: Adapting Vision Transformers for Small Skin Lesion Segmentation Datasets 16 hours ago | arxiv.org

arxiv cs.cv datasets replace +6

Exploring One-shot Semi-supervised Federated Learning with A Pre-trained Diffusion Model 16 hours ago | arxiv.org

abstract arxiv challenges client +17

Senior Machine Learning Engineer

@ GPTZero | Toronto, Canada

View on ai-jobs.net

Sr. Data Operations

@ Carousell Group | West Jakarta, Indonesia

View on ai-jobs.net

Senior Analyst, Business Intelligence & Reporting

@ Deutsche Bank | Bucharest

View on ai-jobs.net

Business Intelligence Subject Matter Expert (SME) - Assistant Vice President

@ Deutsche Bank | Cary, 3000 CentreGreen Way

View on ai-jobs.net

Enterprise Business Intelligence Specialist

@ NAIC | Kansas City

View on ai-jobs.net

Senior Business Intelligence (BI) Developer - Associate

@ Deutsche Bank | Cary, 3000 CentreGreen Way

View on ai-jobs.net