[D] Has anyone looked in active learning or similar techniques for LLM fine-tuning? | allainews.com

May 15, 2023, 1:13 p.m. | /u/igorsusmelj

Machine Learning www.reddit.com

I was wondering if anyone has looked into data sampling or active learning techniques to fine-tune LLMs. Using PEFT methods like LoRA we can use much fewer samples for fine-tuning. But the training data still requires some sort of labels or responses for questions. I found these two datasets that seem commonly used (Alpaca and OASST1). Both seem rather small.

[Alpaca](https://huggingface.co/datasets/tatsu-lab/alpaca) has 52k instructions.
[OpenAssistant Conversations Dataset (OASST1)](https://huggingface.co/datasets/OpenAssistant/oasst1) has 160k messages that result in "in over 10,000 fully annotated conversation …

active learning data fine-tuning labels llm llms lora machinelearning questions responses sampling training training data

More from www.reddit.com / Machine Learning

[D] What are your horror stories from being tasked impossible ML problems 2 hours ago | www.reddit.com

data good horror lost +8

[P] Dreamboothing MusicGen 3 hours ago | www.reddit.com

a100 aim artist build +8

[D] Old Paper - Troubling Trends in Machine Learning Scholarship 4 hours ago | www.reddit.com

free influence issue machine +6

[D] Why transformers are not trained layer-wise? 6 hours ago | www.reddit.com

block example gradient layer +7

[D] Is there an equivalent BigDL project for NVIDIA GPUs, which allows distributing work loads … 10 hours ago | www.reddit.com

cluster gpus library machinelearning +3

[D] What is the best TTS model for my case? 12 hours ago | www.reddit.com

case generate machinelearning question +5

[D] tutorial on how to build streaming ML applications 22 hours ago | www.reddit.com

machinelearning

[D] Why is R^2 so crazy? 23 hours ago | www.reddit.com

baseball games good labels +5

[D] Preserving spatial distribution of data during data splitting 1 day, 3 hours ago | www.reddit.com

data dataset distribution machinelearning +6

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Vice President, AI Product Manager

@ JPMorgan Chase & Co. | New York City, United States

View on ai-jobs.net

Binance Accelerator Program - Data Engineer

@ Binance | Asia

View on ai-jobs.net