"au:"Ching-An Cheng"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Ching-An Cheng"" — arXiv2 Search

Showing 1–20 of 51 results

/ Date/ Name

May 26, 2018Fast Policy Learning through Imitation and Reinforcement Nov 16, 2018RMPflow: A Computational Graph for Automatic Motion Policy Generation Feb 5, 2022Adversarially Trained Actor Critic for Offline Reinforcement Learning Mar 15, 2023PLEX: Making the Most of the Available Data for Robotic Manipulation Pretraining Jun 12, 2018Accelerating Imitation Learning with Predictive Models Mar 29, 2019Stable, Concurrent Controller Composition for Multi-Objective Robotic Tasks Nov 14, 2019A Reduction from Reinforcement Learning to No-Regret Online Learning Mar 15, 2020Intra Order-preserving Functions for Calibration of Multi-Class Neural Networks Jul 13, 2022Hindsight Learning for MDPs with Exogenous Inputs Jul 6, 2020Explaining Fast Improvement in Online Imitation Learning Feb 19, 2019Online Learning with Continuous Variations: Dynamic Regret and Reductions Jun 13, 2021Bellman-consistent Pessimism for Offline Reinforcement Learning Oct 15, 2018Predictor-Corrector Policy Optimization Oct 25, 2018Truncated Back-propagation for Bilevel Optimization Nov 8, 2022ARMOR: A Model-based Framework for Improving Arbitrary Baseline Policies with Offline Data Apr 4, 2024Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences Feb 16, 2024PRISE: LLM-Style Sequence Compression for Learning Temporal Action Abstractions in Control Jun 5, 2021Heuristic-Guided Reinforcement Learning Mar 16, 2026POLCA: Stochastic Generative Optimization with LLM Jan 6, 2023Provable Reset-free Reinforcement Learning by No-Regret Reduction