Online Meta-Learning in Adversarial Multi-Armed Bandits. (arXiv:2205.15921v2 [cs.LG] UPDATED) | allainews.com

July 13, 2022, 1:11 a.m. | Ilya Osadchiy, Kfir Y. Levy, Ron Meir

stat.ML updates on arXiv.org arxiv.org

We study meta-learning for adversarial multi-armed bandits. We consider the
online-within-online setup, in which a player (learner) encounters a sequence
of multi-armed bandit episodes. The player's performance is measured as regret
against the best arm in each episode, according to the losses generated by an
adversary. The difficulty of the problem depends on the empirical distribution
of the per-episode best arm chosen by the adversary. We present an algorithm
that can leverage the non-uniformity in this empirical distribution, and derive …

arxiv learning lg meta meta-learning multi-armed bandits

More from arxiv.org / stat.ML updates on arXiv.org

A Stable and Efficient Covariate-Balancing Estimator for Causal Survival Effects 1 day, 22 hours ago | arxiv.org

abstract art arxiv causal +12

Subgradient Convergence Implies Subdifferential Convergence on Weakly Convex Functions: With Uniform Rates Guarantees 1 day, 22 hours ago | arxiv.org

abstract arxiv challenge convergence +15

A Gaussian Process Model for Ordinal Data with Applications to Chemoinformatics 1 day, 22 hours ago | arxiv.org

abstract applications arxiv create +16

Identification of Single-Treatment Effects in Factorial Experiments 1 day, 22 hours ago | arxiv.org

abstract arxiv cost designs +18

The radius of statistical efficiency 1 day, 22 hours ago | arxiv.org

abstract arxiv companion data +15

Learning 3-Manifold Triangulations 1 day, 22 hours ago | arxiv.org

abstract architectures arxiv databases +13

Multi-Source Conformal Inference Under Distribution Shift 2 days, 22 hours ago | arxiv.org

abstract arxiv concerns data +18

Dynamical systems and complex networks: A Koopman operator perspective 2 days, 22 hours ago | arxiv.org

abstract algorithms arxiv availability +16

Filtered Partial Differential Equations: a robust surrogate constraint in physics-informed deep learning framework 3 days, 22 hours ago | arxiv.org

abstract arxiv data deep learning +24

Software Engineer for AI Training Data (School Specific)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Python)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Tier 2)

@ G2i Inc | Remote

View on ai-jobs.net

Data Engineer

@ Lemon.io | Remote: Europe, LATAM, Canada, UK, Asia, Oceania

View on ai-jobs.net

Artificial Intelligence – Bioinformatic Expert

@ University of Texas Medical Branch | Galveston, TX

View on ai-jobs.net

Lead Developer (AI)

@ Cere Network | San Francisco, US

View on ai-jobs.net