[P] Speed Up Stable Diffusion by ~50% Using Flash Attention | allainews.com

Sept. 24, 2022, 2:31 p.m. | /u/hnipun

Machine Learning www.reddit.com

We got close to 50% speedup on A6000 by replacing most of cross attention operations in the U-Net with flash attention

Annotated Implementation: [https://nn.labml.ai/diffusion/stable\_diffusion/model/unet\_attention.html#section-45](https://nn.labml.ai/diffusion/stable_diffusion/model/unet_attention.html#section-45)

Github: [https://github.com/labmlai/annotated\_deep\_learning\_paper\_implementations/blob/master/labml\_nn/diffusion/stable\_diffusion/model/unet\_attention.py#L192](https://github.com/labmlai/annotated_deep_learning_paper_implementations/blob/master/labml_nn/diffusion/stable_diffusion/model/unet_attention.py#L192)

We used this to speed up our stable diffusion playground: [promptart.labml.ai](https://promptart.labml.ai/)

attention diffusion machinelearning stable diffusion

More from www.reddit.com / Machine Learning

Open-Sourced: Automated Data Sorting Tools [P] 11 hours ago | www.reddit.com

application automated building community +11

[D]What Nomenclature do you follow for naming ML Models? 11 hours ago | www.reddit.com

files inputs kind machinelearning +4

[R]Large language models may not be able to sample behavioral probability distributions 12 hours ago | www.reddit.com

agent agents behavior distribution +12

[R] Reinforcement Learning via Regressing Relative Rewards 15 hours ago | www.reddit.com

algorithm deep rl diffusion diffusion models +3

[D] Clean caption dataset 17 hours ago | www.reddit.com

captions clip dataset datasets +6

[D] LLMs: Why does in-context learning work? What exactly is happening from a technical perspective? 17 hours ago | www.reddit.com

context examples in-context learning knowledge +8

[D] Critical batch size and LLMs 19 hours ago | www.reddit.com

big call kind machinelearning +2

[D] Meta-learning vs Federated Learning? 1 day ago | www.reddit.com

advice federated learning hey hot +5

[P] Multihead Mixture of Experts - Implementation of dense subtoken routing suggested in https://arxiv.org/pdf/2404.15045 1 day, 6 hours ago | www.reddit.com

machinelearning think will

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Principal Machine Learning Engineer (AI, NLP, LLM, Generative AI)

@ Palo Alto Networks | Santa Clara, CA, United States

View on ai-jobs.net

Consultant Senior Data Engineer F/H

@ Devoteam | Nantes, France

View on ai-jobs.net