llm.c

April 9, 2024, 3:24 p.m. |

Simon Willison's Weblog simonwillison.net

Andrej Karpathy implements LLM training - initially for GPT-2, other architectures to follow - in just over 1,000 lines of C on top of CUDA. Includes a tutorial about implementing LayerNorm by porting an implementation from Python.

Via @karpathy

ai andrej karpathy andrejkarpathy architectures cuda generativeai gpt gpt-2 implementation llm llms python training tutorial via

Visit resource

More from simonwillison.net / Simon Willison's Weblog

We can have a different web 5 hours ago | simonwillison.net

audio dog headphones mollywhite +2

Quoting Tom Eastman 5 hours ago | simonwillison.net

five internet remember when text +2

Llama 3 prompt formats 13 hours ago | simonwillison.net

ai clear documentation every +12

Introducing the Claude Team plan and iOS app 16 hours ago | simonwillison.net

access anthropic app claude +11

Save the Web by Being Nice 1 day, 5 hours ago | simonwillison.net

andrew article blog blogging +6

Quoting LMSYS 1 day, 11 hours ago | simonwillison.net

ai api commercial community +9

Quoting D. Richard Hipp 1 day, 18 hours ago | simonwillison.net

analysis code cpu decoding +11

How an empty S3 bucket can make your AWS bill explode 1 day, 20 hours ago | simonwillison.net

aws bill empty s3 +4

My approach to HTML web components 1 day, 21 hours ago | simonwillison.net

components frameworks html isn +11

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Risk Management - Machine Learning and Model Delivery Services, Product Associate - Senior Associate-

@ JPMorgan Chase & Co. | Wilmington, DE, United States

View on ai-jobs.net

Senior ML Engineer (Speech/ASR)

@ ObserveAI | Bengaluru

View on ai-jobs.net

View more jobs

all AI news

llm.c

More from simonwillison.net / Simon Willison's Weblog

Jobs in AI, ML, Big Data

Data Architect

Data ETL Engineer

Lead GNSS Data Scientist

Senior Machine Learning Engineer (MLOps)

Risk Management - Machine Learning and Model Delivery Services, Product Associate - Senior Associate-

Senior ML Engineer (Speech/ASR)