Prioritized Training on Points that are Learnable, Worth Learning, and Not Yet Learnt. (arXiv:2206.07137v3 [cs.LG] UPDATED) | allainews.com

Sept. 27, 2022, 1:14 a.m. | Sören Mindermann, Jan Brauner, Muhammed Razzak, Mrinank Sharma, Andreas Kirsch, Winnie Xu, Benedikt Höltgen, Aidan N. Gomez, Adrien Morisot,

cs.CL updates on arXiv.org arxiv.org

Training on web-scale data can take months. But most computation and time is
wasted on redundant and noisy points that are already learnt or not learnable.
To accelerate training, we introduce Reducible Holdout Loss Selection
(RHO-LOSS), a simple but principled technique which selects approximately those
points for training that most reduce the model's generalization loss. As a
result, RHO-LOSS mitigates the weaknesses of existing data selection methods:
techniques from the optimization literature typically select 'hard' (e.g. high
loss) points, but …

More from arxiv.org / cs.CL updates on arXiv.org

A Survey of Graph Meets Large Language Model: Progress and Future Directions an hour ago | arxiv.org

arxiv cs.cl cs.lg cs.si +9

Never Train from Scratch: Fair Comparison of Long-Sequence Models Requires Data-Driven Priors an hour ago | arxiv.org

abstract architectures arxiv benchmarks +18

LLMCheckup: Conversational Examination of Large Language Models via Interpretability Tools and Self-Explanations an hour ago | arxiv.org

abstract arxiv conversational cs.ai +17

DP-NMT: Scalable Differentially-Private Machine Translation an hour ago | arxiv.org

abstract arxiv concerns concrete +22

DEFT: Data Efficient Fine-Tuning for Pre-Trained Language Models via Unsupervised Core-Set Selection an hour ago | arxiv.org

abstract advances arxiv availability +16

RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models an hour ago | arxiv.org

abstract art arxiv benchmarking +21

Emotionally Numb or Empathetic? Evaluating How LLMs Feel Using EmotionBench an hour ago | arxiv.org

arxiv cs.cl llms type

Noise-Robust De-Duplication at Scale an hour ago | arxiv.org

abstract applications articles arxiv +18

ICDM 2020 Knowledge Graph Contest: Consumer Event-Cause Extraction an hour ago | arxiv.org

abstract applications arxiv attention +16

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Software Engineer, Machine Learning, Payments

@ Google | Bengaluru, Karnataka, India

View on ai-jobs.net

Business Intelligence Analyst, Analytics and Data Science, YouTube

@ Google | Bengaluru, Karnataka, India

View on ai-jobs.net