Benign Underfitting of Stochastic Gradient Descent. (arXiv:2202.13361v3 [cs.LG] UPDATED) | allainews.com

June 8, 2022, 1:12 a.m. | Tomer Koren, Roi Livni, Yishay Mansour, Uri Sherman

stat.ML updates on arXiv.org arxiv.org

We study to what extent may stochastic gradient descent (SGD) be understood
as a "conventional" learning rule that achieves generalization performance by
obtaining a good fit to training data. We consider the fundamental stochastic
convex optimization framework, where (one pass, without-replacement) SGD is
classically known to minimize the population risk at rate $O(1/\sqrt n)$, and
prove that, surprisingly, there exist problem instances where the SGD solution
exhibits both empirical risk and generalization gap of $\Omega(1)$.
Consequently, it turns out that …

arxiv gradient lg stochastic underfitting

More from arxiv.org / stat.ML updates on arXiv.org

Sparse Interaction Neighborhood Selection for Markov Random Fields via Reversible Jump and Pseudoposteriors 18 hours ago | arxiv.org

abstract arxiv bayesian fields +10

PCA for Point Processes 18 hours ago | arxiv.org

abstract analysis arxiv form +15

Inexact subgradient methods for semialgebraic functions 18 hours ago | arxiv.org

abstract arxiv assumptions derivatives +12

Online and Offline Robust Multivariate Linear Regression 18 hours ago | arxiv.org

abstract aim algorithms arxiv +19

Statistical Mechanics Calculations Using Variational Autoregressive Networks and Quantum Annealing 18 hours ago | arxiv.org

abstract approximation arxiv autoregressive +13

A model-free subdata selection method for classification 18 hours ago | arxiv.org

abstract analysis arxiv big +11

Unifying Simulation and Inference with Normalizing Flows 18 hours ago | arxiv.org

abstract applications arxiv automated +20

A Strategy for Preparing Quantum Squeezed States Using Reinforcement Learning 1 day, 18 hours ago | arxiv.org

abstract application arxiv collective +13

Robust Bayesian Inference for Berkson and Classical Measurement Error Models 1 day, 18 hours ago | arxiv.org

abstract arxiv bayesian bayesian inference +11

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Software Engineer, Data Tools - Full Stack

@ DoorDash | Pune, India

View on ai-jobs.net

Senior Data Analyst

@ Artsy | New York City

View on ai-jobs.net