"au:"Kianté Brantley"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Kianté Brantley"" — arXiv2 Search

Showing 1–20 of 32 results

/ Date/ Name

Jul 10, 2023Ranking with Long-Term Constraints May 26, 2020Active Imitation Learning with Noisy Guidance Mar 3, 2021Successor Feature Sets: Generalizing Successor Representations Across Policies Oct 21, 2025The Emergence of Complex Behavior in Large-Scale Ecological Environments Feb 26, 2024A Surprising Failure? Multimodal LLMs and the NLVR Challenge Oct 3, 2022Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization Jun 9, 2020Constrained episodic reinforcement learning in concave-convex and knapsack settings Mar 2, 2023Interactive Text Generation Apr 12, 2024Adversarial Imitation Learning via Boosting Jul 23, 2015LDAExplore: Visualizing Topic Models Generated Using Latent Dirichlet Allocation Oct 9, 2025Expressive Value Learning for Scalable Offline Reinforcement Learning Apr 9, 2026$p1$: Better Prompt Optimization with Fewer Prompts Apr 25, 2024REBEL: Reinforcement Learning via Regressing Relative Rewards Aug 3, 2017The UMD Neural Machine Translation Systems at WMT17 Bandit Learning Task May 28, 2025Scaling Offline RL via Efficient and Expressive Shortcut Models Oct 6, 2024Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF Oct 15, 2025Breadcrumbs Reasoning: Memory-Efficient Reasoning with Compression Beacons Feb 22, 2026LLMs Can Learn to Reason Via Off-Policy RL Feb 5, 2019Non-Monotonic Sequential Text Generation Apr 12, 2024Dataset Reset Policy Optimization for RLHF