"au:"Abbas Abdolmaleki"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Abbas Abdolmaleki"" — arXiv2 Search

Showing 1–20 of 42 results

/ Date/ Name

Dec 18, 2023Mastering Stacking of Diverse Shapes with Large-Scale Iterative Reinforcement Learning on Real Robots Jun 14, 2018Maximum a Posteriori Policy Optimisation Jun 15, 2021On Multi-objective Policy Optimization as a Tool for Reinforcement Learning: Case Studies in Offline RL and Finetuning Dec 5, 2018Relative Entropy Regularized Policy Iteration Oct 5, 2024Learning from negative feedback, or positive feedback or both Feb 19, 2020Keep Doing What Worked: Behavioral Modelling Priors for Offline Reinforcement Learning Jun 18, 2019Robust Reinforcement Learning for Continuous Control with Model Misspecification Oct 7, 2021Evaluating model-based planning and planner amortization for continuous control Jun 1, 2020Acme: A Research Framework for Distributed Reinforcement Learning May 6, 2022How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation Sep 5, 2024Game On: Towards Language Models as RL Experimenters Jul 7, 2025Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities Apr 12, 2022Forgetting and Imbalance in Robot Lifelong Learning with Off-policy Data Oct 29, 2020"What, not how": Solving an under-actuated insertion task from scratch Jun 26, 2019Compositional Transfer in Hierarchical Reinforcement Learning Oct 1, 2019Augmenting learning using symmetry in a biologically-inspired domain May 25, 2021From Motor Control to Team Play in Simulated Humanoid Football Jan 2, 2018DeepMind Control Suite Jul 9, 2025Value from Observations: Towards Large-Scale Imitation Learning via Self-Improvement Nov 24, 2022SkillS: Adaptive Skill Sequencing for Efficient Temporally-Extended Exploration