[D] Phi-3 models compared side-by-side. | allainews.com

May 23, 2024, 2:19 p.m. | /u/dark_surfer

Machine Learning www.reddit.com

https://preview.redd.it/8l04pnfhq62d1.png?width=661&format=png&auto=webp&s=7fe616ca8cd7da974070c86b6b47ffab3ab545e5

---------------------------------------------------------------------------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------------------------------------------------

https://preview.redd.it/hr7fr1uiq62d1.png?width=688&format=png&auto=webp&s=bd3de359bfe4c1ed82d092be92ae38c246bdfda2

---------------------------------------------------------------------------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------------------------------------------------

https://preview.redd.it/v6k3v39kq62d1.png?width=450&format=png&auto=webp&s=c0abb0e397a498ef7ccfb35b1b1cb598198f66ad

For anyone looking to compare the Phi-3 benchmarks in one place.

Interesting comparisons for: ANLI, Hellaswag, MedQA, TriviaQA, Language understanding, Factual Knowledge and Robustness.

Note: Phi-3 mini model table have labels in different order.

benchmarks knowledge labels language language understanding machinelearning phi phi-3 robustness table understanding

More from www.reddit.com / Machine Learning

[R] Grade Score: Quantifying LLM Performance in Option Selection 9 hours ago | www.reddit.com

llm llm performance machinelearning performance +1

[R] Why there are few high-quality works about federated learning with time series forecasting? 10 hours ago | www.reddit.com

conferences federated learning forecasting found +14

[D] model merging -- what's your take? 11 hours ago | www.reddit.com

experience machinelearning merging performance +5

[D] which universities and research centers are focusing on adversarial machine learning (especially in Germany) … 18 hours ago | www.reddit.com

adversarial adversarial learning adversarial machine learning core +12

[R] M3-AUDIODEC: Multi-channel multi-speaker multi-spatial audio codec 1 day, 2 hours ago | www.reddit.com

audio codec machinelearning spatial +1

[P] C-GAN based MNIST model evaluator/validator 1 day, 6 hours ago | www.reddit.com

building gan gans generative +5

[R] [CVPR 2024] AV-RIR: Audio-Visual Room Impulse Response Estimation 1 day, 7 hours ago | www.reddit.com

audio cvpr machinelearning room +1

[Research] Exploiting the Layered Intrinsic Dimensionality for Practical Adversarial Training 1 day, 8 hours ago | www.reddit.com

adversarial adversarial training aes algorithm +16

[D] Patenting in ML 1 day, 10 hours ago | www.reddit.com

academia algorithms application applications +10

AI Focused Biochemistry Postdoctoral Fellow

@ Lawrence Berkeley National Lab | Berkeley, CA

View on ai-jobs.net

Senior Data Engineer

@ Displate | Warsaw

View on ai-jobs.net

Lead, Sales Operations Strategy EMEA - 12 Month Fixed Term Contract

@ Snap Inc. | London - 50 Cowcross Street

View on ai-jobs.net

Senior Staff Engineer- Observability and Reliability Platform Engineering (REMOTE)

@ GEICO | MD Chevy Chase (Office) - JPS

View on ai-jobs.net

Senior Manager, Software Quality Assurance

@ IQVIA | Ottawa, Ontario, Canada

View on ai-jobs.net

Associate, Software Application Engineer

@ BlackRock | MU8-South (A) Wing, 7-10 Floor, Nesco IT Park Tower 4, Western Express Highway, Mumbai

View on ai-jobs.net