CrossGET: Cross-Guided Ensemble of Tokens for Accelerating Vision-Language Transformers | allainews.com

June 17, 2024, 4:41 a.m. | Dachuan Shi, Chaofan Tao, Anyi Rao, Zhendong Yang, Chun Yuan, Jiaqi Wang

cs.CL updates on arXiv.org arxiv.org

arXiv:2305.17455v4 Announce Type: replace-cross
Abstract: Recent vision-language models have achieved tremendous advances. However, their computational costs are also escalating dramatically, making model acceleration exceedingly critical. To pursue more efficient vision-language Transformers, this paper introduces Cross-Guided Ensemble of Tokens (CrossGET), a general acceleration framework for vision-language Transformers. This framework adaptively combines tokens in real-time during inference, significantly reducing computational costs while maintaining high performance. CrossGET features two primary innovations: 1) Cross-Guided Matching and Ensemble. CrossGET leverages cross-modal guided token matching and …

arxiv cs.cl cs.cv ensemble language replace tokens transformers type vision vision-language

More from arxiv.org / cs.CL updates on arXiv.org

A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models 8 hours ago | arxiv.org

abstract arxiv challenge contents +22

NExT-GPT: Any-to-Any Multimodal LLM 8 hours ago | arxiv.org

arxiv cs.ai cs.cl cs.lg +6

Practical Membership Inference Attacks against Fine-tuned Large Language Models via Self-prompt Calibration 8 hours ago | arxiv.org

abstract aim arxiv attacks +22

Knowledge Crosswords: Geometric Knowledge Reasoning with Large Language Models 8 hours ago | arxiv.org

abstract arxiv benchmark beyond +16

LinkTransformer: A Unified Package for Record Linkage with Transformer Language Models 8 hours ago | arxiv.org

abstract arxiv business cs.cl +23

S$^3$HQA: A Three-Stage Approach for Multi-hop Text-Table Hybrid Question Answering 8 hours ago | arxiv.org

abstract arxiv cs.cl framework +16

COFFEE: A Contrastive Oracle-Free Framework for Event Extraction 8 hours ago | arxiv.org

abstract annotations arxiv classification +19

Fine-Grained Detection of Solidarity for Women and Migrants in 155 Years of German Parliamentary Debates 8 hours ago | arxiv.org

abstract arxiv concept cs.cl +14

FedBiOT: LLM Local Fine-tuning in Federated Learning without Full Model 8 hours ago | arxiv.org

abstract arxiv cs.cl cs.dc +21

AI Focused Biochemistry Postdoctoral Fellow

@ Lawrence Berkeley National Lab | Berkeley, CA

View on ai-jobs.net

Senior Data Engineer

@ Displate | Warsaw

View on ai-jobs.net

Data Architect

@ Unison Consulting Pte Ltd | Kuala Lumpur, Federal Territory of Kuala Lumpur, Malaysia

View on ai-jobs.net

Data Architect

@ Games Global | Isle of Man, Isle of Man

View on ai-jobs.net

Enterprise Data Architect

@ Ent Credit Union | Colorado Springs, CO, United States

View on ai-jobs.net

Lead Data Architect (AWS, Azure, GCP)

@ CapTech Consulting | Chicago, IL, United States

View on ai-jobs.net