Google's Speech AI AudioPaLM Performs Translation with Voice Transfer | allainews.com

July 11, 2023, 1 p.m. | Anthony Alford

InfoQ - AI, ML & Data Engineering www.infoq.com

Researchers at Google announced AudioPaLM, a large language model (LLM) that performs text-to-speech (TTS), automated speech recognition (ASR), and speech-to-speech translation (S2ST) with voice transfer. AudioPaLM is based on the PaLM-2 LLM and outperforms OpenAI's Whisper on translation benchmarks.

By Anthony Alford

ai anthony asr automated automated speech recognition benchmarks google language language model large language large language model large language models llm ml & data engineering natural language processing openai palm recognition researchers s2st speech speech ai speech recognition speech-to-speech translation text text-to-speech transfer translation tts voice whisper

More from www.infoq.com / InfoQ - AI, ML & Data Engineering

Rachael Greaves at QCon London: Ethical AI Can Decrease the Impact of Data Breaches 1 day, 7 hours ago | www.infoq.com

ai architecture & design artificial intelligence benefits +23

For Practitioners, by Practitioners: Solve Your Software Challenges at InfoQ & QCon Software Events 2 days, 11 hours ago | www.infoq.com

ai architecture & design best practices challenges +21

Podcast: Navigating AI, Platform Engineering, and Staff-Plus: InfoQ Dev Summit Boston Preview 3 days, 12 hours ago | www.infoq.com

ai architecture architecture & design boston +27

Presentation: Combating AI-Generated Fake Images with JavaScript Libraries 3 days, 13 hours ago | www.infoq.com

ai artificial intelligence development digital +14

Stability AI Releases 3D Model Generation AI Stable Video 3D 4 days, 10 hours ago | www.infoq.com

2d image 3d model generation 3d object ai +23

Mistral Large Foundation Model Now Available on Amazon Bedrock 4 days, 12 hours ago | www.infoq.com

ai ai models amazon amazon bedrock +16

Java News Roundup: Jakarta EE 11-M2, JEPs Targeted for JDK 23, Spring Boot, Hibernate, GlassFish 5 days, 9 hours ago | www.infoq.com

ai alpha apache tomcat apache tomee +37

Yelp Overhauls Its Streaming Architecture with Apache Beam and Apache Flink 5 days, 16 hours ago | www.infoq.com

ai amazon amazon redshift apache +23

Airbnb Open-Sources its ML Feature Platform Chronon 1 week, 2 days ago | www.infoq.com

ai airbnb automated machine learning create +16

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Director, Clinical Data Science

@ Aura | Remote USA

View on ai-jobs.net

Research Scientist, AI (PhD)

@ Meta | Menlo Park, CA | New York City

View on ai-jobs.net