"au:"Abbas Abdolmaleki"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Abbas Abdolmaleki"" — arXiv2 Search

Showing 21–40 of 42 results

/ Date/ Name

May 25, 2021From Motor Control to Team Play in Simulated Humanoid Football Jan 2, 2018DeepMind Control Suite Jul 9, 2025Value from Observations: Towards Large-Scale Imitation Learning via Self-Improvement Oct 12, 2020Local Search for Policy Iteration in Continuous Control May 15, 2020A Distributional View on Multi-Objective Policy Optimization Oct 9, 2019Imagined Value Gradients: Model-Based Policy Optimization with Transferable Latent Dynamics Models Sep 26, 2019V-MPO: On-Policy Maximum a Posteriori Policy Optimization for Discrete and Continuous Control Jan 2, 2020Continuous-Discrete Reinforcement Learning for Hybrid Control in Robotics Jul 30, 2020Data-efficient Hindsight Off-policy Option Learning Feb 12, 2019Value constrained model-free continuous control Jun 29, 2016Model-Free Trajectory-based Policy Optimization with Monotonic Improvement May 22, 2017Guide Actor-Critic for Continuous Control Feb 8, 2024Offline Actor-Critic Reinforcement Learning Scales to Large Models Feb 24, 2023Leveraging Jumpy Models for Planning and Fast Learning in Robotic Domains Oct 2, 2025Gemini Robotics 1.5: Pushing the Frontier of Generalist Robots with Advanced Embodied Reasoning, Thinking, and Motion Transfer Jun 20, 2023RoboCat: A Self-Improving Generalist Agent for Robotic Manipulation Aug 29, 2023Policy composition in reinforcement learning via multi-objective policy optimization Apr 21, 2022Revisiting Gaussian mixture critics in off-policy reinforcement learning: a sample-based approach Nov 5, 2019Quinoa: a Q-function You Infer Normalized Over Actions Feb 13, 2019Simultaneously Learning Vision and Feature-based Control Policies for Real-world Ball-in-a-Cup

← Previous Next →