CM-TTS: Enhancing Real Time Text-to-Speech Synthesis Efficiency through Weighted Samplers and Consistency Models | allainews.com

April 2, 2024, 7:52 p.m. | Xiang Li, Fan Bu, Ambuj Mehrish, Yingting Li, Jiale Han, Bo Cheng, Soujanya Poria

cs.CL updates on arXiv.org arxiv.org

arXiv:2404.00569v1 Announce Type: cross
Abstract: Neural Text-to-Speech (TTS) systems find broad applications in voice assistants, e-learning, and audiobook creation. The pursuit of modern models, like Diffusion Models (DMs), holds promise for achieving high-fidelity, real-time speech synthesis. Yet, the efficiency of multi-step sampling in Diffusion Models presents challenges. Efforts have been made to integrate GANs with DMs, speeding up inference by approximating denoising distributions, but this introduces issues with model convergence due to adversarial training. To overcome this, we introduce CM-TTS, …

abstract applications arxiv assistants audiobook challenges cs.cl cs.sd diffusion diffusion models eess.as efficiency e-learning fidelity modern real-time sampling speech synthesis systems text text-to-speech through tts type voice voice assistants

More from arxiv.org / cs.CL updates on arXiv.org

Learning Approximate and Exact Numeral Systems via Reinforcement Learning 2 hours ago | arxiv.org

abstract arxiv communication cs.ai +13

PANGeA: Procedural Artificial Narrative using Generative AI for Turn-Based Video Games 2 hours ago | arxiv.org

abstract applications artificial arxiv +20

Enhancing Trust in LLM-Generated Code Summaries with Calibrated Confidence Scores 2 hours ago | arxiv.org

abstract arxiv code confidence +14

Multi-hop Question Answering over Knowledge Graphs using Large Language Models 2 hours ago | arxiv.org

abstract arxiv cs.ai cs.cl +25

Blind Spots and Biases: Exploring the Role of Annotator Cognitive Biases in NLP 2 hours ago | arxiv.org

abstract academia artificial artificial intelligence +21

Better & Faster Large Language Models via Multi-token Prediction 2 hours ago | arxiv.org

abstract arxiv cs.cl efficiency +20

Iterative Reasoning Preference Optimization 2 hours ago | arxiv.org

abstract arxiv chen cs.ai +12

ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children … 2 hours ago | arxiv.org

abstract arxiv challenges children +18

Automated Generation of High-Quality Medical Simulation Scenarios Through Integration of Semi-Structured Data and Large Language … 2 hours ago | arxiv.org

abstract arxiv automate automated +20

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Senior Data Engineer

@ Cint | Gurgaon, India

View on ai-jobs.net

Data Science (M/F), setor automóvel - Aveiro

@ Segula Technologies | Aveiro, Portugal

View on ai-jobs.net