Towards Principled Representation Learning from Videos for Reinforcement Learning | allainews.com

March 21, 2024, 4:42 a.m. | Dipendra Misra, Akanksha Saran, Tengyang Xie, Alex Lamb, John Langford

cs.LG updates on arXiv.org arxiv.org

arXiv:2403.13765v1 Announce Type: new
Abstract: We study pre-training representations for decision-making using video data, which is abundantly available for tasks such as game agents and software testing. Even though significant empirical advances have been made on this problem, a theoretical understanding remains absent. We initiate the theoretical investigation into principled approaches for representation learning and focus on learning the latent state representations of the underlying MDP using video data. We study two types of settings: one where there is iid …

abstract advances agents arxiv cs.ai cs.cv cs.lg data decision game investigation making pre-training reinforcement reinforcement learning representation representation learning software software testing study tasks testing training type understanding video video data videos

More from arxiv.org / cs.LG updates on arXiv.org

Training towards significance with the decorrelated event classifier transformer neural network 1 day, 10 hours ago | arxiv.org

abstract analysis application arxiv +28

An adaptive standardisation methodology for Day-Ahead electricity price forecasting 1 day, 10 hours ago | arxiv.org

abstract algorithms arxiv complexity +18

SYNAuG: Exploiting Synthetic Data for Data Imbalance Problems 1 day, 10 hours ago | arxiv.org

abstract arxiv cs.cv cs.lg +17

Semantic Positive Pairs for Enhancing Visual Representation Learning of Instance Discrimination methods 1 day, 10 hours ago | arxiv.org

abstract algorithms arxiv augmentation +17

Description-Based Text Similarity 1 day, 10 hours ago | arxiv.org

abstract arxiv cases cs.cl +14

Improving Gradient Methods via Coordinate Transformations: Applications to Quantum Machine Learning 1 day, 10 hours ago | arxiv.org

abstract algorithms applications arxiv +13

A Generative Framework for Low-Cost Result Validation of Machine Learning-as-a-Service Inference 1 day, 10 hours ago | arxiv.org

abstract applications arxiv as-a-service +26

Digital Over-the-Air Federated Learning in Multi-Antenna Systems 1 day, 10 hours ago | arxiv.org

abstract arxiv communication computation +16

Bagging Provides Assumption-free Stability 1 day, 10 hours ago | arxiv.org

abstract algorithm arxiv assumptions +15

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Principal Applied Scientist

@ Microsoft | Redmond, Washington, United States

View on ai-jobs.net

Data Analyst / Action Officer

@ OASYS, INC. | OASYS, INC., Pratt Avenue Northwest, Huntsville, AL, United States

View on ai-jobs.net