How do languages influence each other? Studying cross-lingual data sharing during LM fine-tuning | allainews.com

May 22, 2024, 4:47 a.m. | Rochelle Choenni, Dan Garrette, Ekaterina Shutova

cs.CL updates on arXiv.org arxiv.org

arXiv:2305.13286v2 Announce Type: replace
Abstract: Multilingual large language models (MLLMs) are jointly trained on data from many different languages such that representation of individual languages can benefit from other languages' data. Impressive performance on zero-shot cross-lingual transfer shows that these models are capable of exploiting data from other languages. Yet, it remains unclear to what extent, and under which conditions, languages rely on each other's data. In this study, we use TracIn (Pruthi et al., 2020), a training data attribution …

abstract arxiv benefit cross-lingual cs.cl data data sharing fine-tuning influence language language models languages large language large language models mllms multilingual performance replace representation shows studying transfer type zero-shot

More from arxiv.org / cs.CL updates on arXiv.org

Multimodal Learning Without Labeled Multimodal Data: Guarantees and Applications 1 day, 17 hours ago | arxiv.org

abstract applications arxiv challenge +26

Unlearning Traces the Influential Training Data of Language Models 1 day, 17 hours ago | arxiv.org

abstract arxiv cs.ai cs.cl +17

Axis Tour: Word Tour Determines the Order of Axes in ICA-transformed Embeddings 1 day, 17 hours ago | arxiv.org

abstract analysis arxiv components +20

Japanese Tort-case Dataset for Rationale-supported Legal Judgment Prediction 1 day, 17 hours ago | arxiv.org

abstract arxiv case court +14

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI 1 day, 17 hours ago | arxiv.org

abstract agi art arxiv +21

ConceptPsy:A Benchmark Suite with Conceptual Comprehensiveness in Psychology 1 day, 17 hours ago | arxiv.org

abstract arxiv benchmark benchmarks +19

MC$^2$: Towards Transparent and Culturally-Aware NLP for Minority Languages in China 1 day, 17 hours ago | arxiv.org

abstract accessibility arxiv challenge +19

Dodo: Dynamic Contextual Compression for Decoder-only LMs 1 day, 17 hours ago | arxiv.org

abstract arxiv attention compression +23

Active Learning for Multilingual Fingerspelling Corpora 1 day, 17 hours ago | arxiv.org

abstract active learning analysis apply +16

Senior Data Engineer

@ Displate | Warsaw

View on ai-jobs.net

Analyst, Data Analytics

@ T. Rowe Price | Owings Mills, MD - Building 4

View on ai-jobs.net

Regulatory Data Analyst

@ Federal Reserve System | San Francisco, CA

View on ai-jobs.net

Sr. Data Analyst

@ Bank of America | Charlotte

View on ai-jobs.net

Data Analyst- Tech Refresh

@ CACI International Inc | 1J5 WASHINGTON DC (BOLLING AFB)

View on ai-jobs.net

Senior AML/CFT & Data Analyst

@ Ocorian | Ebène, Mauritius

View on ai-jobs.net