"au:"Max Sobol Mark"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Max Sobol Mark"" — arXiv2 Search

Showing 1–6 of 6 results

/ Date/ Name

Oct 12, 2023Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias Dec 9, 2024Policy Agnostic RL: Offline RL and Online RL Fine-Tuning of Any Class and Backbone Feb 16, 2026BPP: Long-Context Robot Imitation Learning by Focusing on Key History Frames Oct 23, 2023Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for Autonomous Real-World Reinforcement Learning May 28, 2019Unsupervised Learning from Video with Deep Neural Embeddings Mar 9, 2023Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning