Multimodality and Large Multimodal Models (LMMs) | allainews.com

Oct. 10, 2023, midnight |

Chip Huyen huyenchip.com

For a long time, each ML model operated in one data mode – text (translation, language modeling), image (object detection, image classification), or audio (speech recognition).

However, natural intelligence is not limited to just a single modality. Humans can read and write text. We can see images and watch videos. We listen to music to relax and watch out for strange noises to detect danger. Being able to work with multimodal data is essential for us or any AI to …

audio classification data detection humans image images intelligence language modeling multimodal multimodality multimodal models music natural recognition speech speech recognition text translation videos

More from huyenchip.com / Chip Huyen

Measuring personal growth 2 weeks, 2 days ago | huyenchip.com

arr business business growth founder +6

What I learned from looking at 900 most popular open source AI tools 1 month, 2 weeks ago | huyenchip.com

ai tools analysis ecosystem foundation +8

Predictive Human Preference: From Model Ranking to Model Routing 2 months ago | huyenchip.com

arena chatbot contents data +11

Sampling for Text Generation 3 months, 2 weeks ago | huyenchip.com

change cuisine imagine ml models +5

Multimodality and Large Multimodal Models (LMMs) 6 months, 3 weeks ago | huyenchip.com

audio classification data detection +17

Open challenges in LLM research 8 months, 2 weeks ago | huyenchip.com

academia challenges industry life +8

Generative AI Strategy 10 months, 3 weeks ago | huyenchip.com

ai strategy conversations fun generative +3

RLHF: Reinforcement Learning from Human Feedback 1 year ago | huyenchip.com

chat chatgpt compute data +15

Building LLM applications for production 1 year ago | huyenchip.com

applications building change companies +18

AI Research Scientist

@ Vara | Berlin, Germany and Remote

View on ai-jobs.net

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Data Analyst (Digital Business Analyst)

@ Activate Interactive Pte Ltd | Singapore, Central Singapore, Singapore

View on ai-jobs.net