Deep Double Descent for Time Series Forecasting: Avoiding Undertrained Models. (arXiv:2311.01442v1 [cs.LG]) | allainews.com

Nov. 5, 2023, 6:43 a.m. | Valentino Assandri, Sam Heshmati, Burhaneddin Yaman, Anton Iakovlev, Ariel Emiliano Repetur

cs.LG updates on arXiv.org arxiv.org

Deep learning models, particularly Transformers, have achieved impressive
results in various domains, including time series forecasting. While existing
time series literature primarily focuses on model architecture modifications
and data augmentation techniques, this paper explores the training schema of
deep learning models for time series; how models are trained regardless of
their architecture. We perform extensive experiments to investigate the
occurrence of deep double descent in several Transformer models trained on
public time series data sets. We demonstrate epoch-wise deep double …

architecture arxiv augmentation data deep learning domains forecasting literature paper schema series time series time series forecasting training transformers

More from arxiv.org / cs.LG updates on arXiv.org

Transforming gradient-based techniques into interpretable methods 22 hours ago | arxiv.org

abstract arxiv challenges cnn +20

ChatQA: Surpassing GPT-4 on Conversational QA and RAG 22 hours ago | arxiv.org

arxiv conversational cs.ai cs.cl +7

Towards Truly Zero-shot Compositional Visual Reasoning with LLMs as Programmers 22 hours ago | arxiv.org

abstract arxiv cs.ai cs.cv +22

Calibrating Wireless Ray Tracing for Digital Twinning using Local Phase Error Estimates 22 hours ago | arxiv.org

abstract access arxiv construct +22

Graph Network Surrogate Model for Subsurface Flow Optimization 22 hours ago | arxiv.org

abstract arxiv co2 cs.lg +16

Double Machine Learning for Static Panel Models with Fixed Effects 22 hours ago | arxiv.org

abstract advances algorithms arxiv +20

Dynamic Adversarial Attacks on Autonomous Driving Systems 22 hours ago | arxiv.org

abstract adversarial adversarial attacks arxiv +22

BioCLIP: A Vision Foundation Model for the Tree of Life 22 hours ago | arxiv.org

arxiv cs.cl cs.cv cs.lg +7

On the convergence of adaptive first order methods: proximal gradient and alternating minimization algorithms 22 hours ago | arxiv.org

abstract algorithms arxiv building +12

Software Engineer for AI Training Data (School Specific)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Python)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Tier 2)

@ G2i Inc | Remote

View on ai-jobs.net

Data Engineer

@ Lemon.io | Remote: Europe, LATAM, Canada, UK, Asia, Oceania

View on ai-jobs.net

Artificial Intelligence – Bioinformatic Expert

@ University of Texas Medical Branch | Galveston, TX

View on ai-jobs.net

Lead Developer (AI)

@ Cere Network | San Francisco, US

View on ai-jobs.net