Towards Learning Universal Hyperparameter Optimizers with Transformers. (arXiv:2205.13320v1 [cs.LG]) | allainews.com

May 27, 2022, 1:11 a.m. | Yutian Chen, Xingyou Song, Chansoo Lee, Zi Wang, Qiuyi Zhang, David Dohan, Kazuya Kawakami, Greg Kochanski, Arnaud Doucet, Marc'aurelio Ranzato,

stat.ML updates on arXiv.org arxiv.org

Meta-learning hyperparameter optimization (HPO) algorithms from prior
experiments is a promising approach to improve optimization efficiency over
objective functions from a similar distribution. However, existing methods are
restricted to learning from experiments sharing the same set of
hyperparameters. In this paper, we introduce the OptFormer, the first
text-based Transformer HPO framework that provides a universal end-to-end
interface for jointly learning policy and function prediction when trained on
vast tuning data from the wild. Our extensive experiments demonstrate that the
OptFormer …

arxiv learning transformers

More from arxiv.org / stat.ML updates on arXiv.org

Distributional Preference Learning: Understanding and Accounting for Hidden Context in RLHF 6 minutes ago | arxiv.org

accounting arxiv context cs.ai +6

Hacking Task Confounder in Meta-Learning 6 minutes ago | arxiv.org

abstract arxiv cs.lg hacking +12

Reflection coupling for unadjusted generalized Hamiltonian Monte Carlo in the nonconvex stochastic gradient case 6 minutes ago | arxiv.org

abstract algorithms arxiv case +10

Provable Reward-Agnostic Preference-Based Reinforcement Learning 6 minutes ago | arxiv.org

abstract agent arxiv cs.ai +16

Mastering Diverse Domains through World Models 6 minutes ago | arxiv.org

abstract algorithm algorithms application +22

Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models 6 minutes ago | arxiv.org

abstract arxiv cs.it cs.lg +14

Additive Covariance Matrix Models: Modelling Regional Electricity Net-Demand in Great Britain 6 minutes ago | arxiv.org

abstract arxiv britain consumption +18

Learning Algorithm Generalization Error Bounds via Auxiliary Distributions 6 minutes ago | arxiv.org

abstract algorithm arxiv cs.it +16

Forecasting Algorithms for Causal Inference with Panel Data 6 minutes ago | arxiv.org

abstract adapt algorithm algorithms +23

Data Scientist (m/f/x/d)

@ Symanto Research GmbH & Co. KG | Spain, Germany

View on ai-jobs.net

Data Operations Analyst

@ Workday | Poland, Warsaw

View on ai-jobs.net

Reference Data Specialist - Operations Analyst

@ JPMorgan Chase & Co. | Bengaluru, Karnataka, India

View on ai-jobs.net

Data Scientist (Redwood City)

@ Anomali | Redwood City, CA

View on ai-jobs.net

Software Engineer, Database - Languages & Relational Technologies

@ YugabyteDB | United States (Remote) or Sunnyvale, CA

View on ai-jobs.net

Data Analyst (m/f/d) Online Marketing

@ StepStone Group | Düsseldorf, Germany

View on ai-jobs.net