Superposition Prompting: Improving and Accelerating Retrieval-Augmented Generation | allainews.com

April 11, 2024, 4:42 a.m. | Thomas Merth, Qichen Fu, Mohammad Rastegari, Mahyar Najibi

cs.LG updates on arXiv.org arxiv.org

arXiv:2404.06910v1 Announce Type: cross
Abstract: Despite the successes of large language models (LLMs), they exhibit significant drawbacks, particularly when processing long contexts. Their inference cost scales quadratically with respect to sequence length, making it expensive for deployment in some real-world text processing applications, such as retrieval-augmented generation (RAG). Additionally, LLMs also exhibit the "distraction phenomenon," where irrelevant context in the prompt degrades output quality. To address these drawbacks, we propose a novel RAG prompting methodology, superposition prompting, which can be …

abstract applications arxiv cost cs.ai cs.cl cs.lg deployment improving inference language language models large language large language models llms making processing prompting rag retrieval retrieval-augmented superposition text type world

More from arxiv.org / cs.LG updates on arXiv.org

Differentially private Bayesian tests 2 hours ago | arxiv.org

abstract arxiv bayesian cs.cr +20

What Are We Optimizing For? A Human-centric Evaluation of Deep Learning-based Movie Recommenders 2 hours ago | arxiv.org

abstract accuracy arxiv benchmark +21

Attention-Enhanced Reservoir Computing 2 hours ago | arxiv.org

abstract accuracy arxiv attention +11

Learning finitely correlated states: stability of the spectral reconstruction 2 hours ago | arxiv.org

abstract arxiv cs.et cs.lg +10

Transfer Learning in Robotics: An Upcoming Breakthrough? A Review of Promises and Challenges 2 hours ago | arxiv.org

abstract agents arxiv challenges +17

The Perception-Robustness Tradeoff in Deterministic Image Restoration 2 hours ago | arxiv.org

abstract arxiv behavior consistent +13

Conformal Decision Theory: Safe Autonomous Decisions from Imperfect Predictions 2 hours ago | arxiv.org

abstract algorithms arxiv autonomous +20

Fin-Fact: A Benchmark Dataset for Multimodal Financial Fact Checking and Explanation Generation 2 hours ago | arxiv.org

arxiv benchmark cs.ai cs.ce +6

TExplain: Explaining Learned Visual Features via Pre-trained (Frozen) Language Models 2 hours ago | arxiv.org

abstract arxiv capabilities challenge +16

AI Research Scientist

@ Vara | Berlin, Germany and Remote

View on ai-jobs.net

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

AI Engineering Manager

@ M47 Labs | Barcelona, Catalunya [Cataluña], Spain

View on ai-jobs.net