You can now train a 70b language model at home | allainews.com

s

March 8, 2024, 10:47 a.m. |

Simon Willison's Weblog simonwillison.net

You can now train a 70b language model at home

Jeremy Howard and team: "Today, we’re releasing Answer.AI’s first project: a fully open source system that, for the first time, can efficiently train a 70b large language model on a regular desktop computer with two or more standard gaming GPUs (RTX 3090 or 4090)."

This is about fine-tuning an existing model, not necessarily training one from scratch.

There are two tricks at play here. The first is QLoRA, which can …

70b ai computer desktop gaming generativeai gpus home howard jeremyhoward language language model large language large language model llms open source project standard team train

More from simonwillison.net / Simon Willison's Weblog

Si

Printing music with CSS Grid 18 minutes ago | simonwillison.net

application bond column css +10

Si

We can have a different web 12 hours ago | simonwillison.net

audio dog headphones mollywhite +2

Si

Quoting Tom Eastman 12 hours ago | simonwillison.net

five internet remember when text +2

Si

Llama 3 prompt formats 20 hours ago | simonwillison.net

ai clear documentation every +12

Si

Introducing the Claude Team plan and iOS app 22 hours ago | simonwillison.net

access anthropic app claude +11

Si

Save the Web by Being Nice 1 day, 12 hours ago | simonwillison.net

andrew article blog blogging +6

Si

Quoting LMSYS 1 day, 18 hours ago | simonwillison.net

ai api commercial community +9

Si

Quoting D. Richard Hipp 2 days ago | simonwillison.net

analysis code cpu decoding +11

Si

How an empty S3 bucket can make your AWS bill explode 2 days, 3 hours ago | simonwillison.net

aws bill empty s3 +4

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Senior Data Engineer

@ Quantexa | Sydney, New South Wales, Australia

View on ai-jobs.net

Staff Analytics Engineer

@ Warner Bros. Discovery | NY New York 230 Park Avenue South

View on ai-jobs.net