"au:"Jacob Beck"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jacob Beck"" — arXiv2 Search

Showing 1–18 of 18 results

/ Date/ Name

Mar 2, 2025Offline RLAIF: Piloting VLM Feedback for RL via SFO Sep 10, 2025Bias in the Loop: How Humans Evaluate AI-Generated Suggestions Oct 10, 2024Metalic: Meta-Learning In-Context with Protein Language Models Sep 26, 2023Recurrent Hypernetworks are Surprisingly Strong in Meta-RL Oct 20, 2022Hypernetworks in Meta-Reinforcement Learning Jul 29, 2018Neural Mesh: Introducing a Notion of Space and Conservation of Energy to Neural Networks Jan 16, 2019ReNeg and Backseat Driver: Learning from Demonstration with Continuous Human Feedback Mar 5, 2024SplAgger: Split Aggregation for Meta-Reinforcement Learning Jan 19, 2023A Tutorial on Meta-Reinforcement Learning Feb 22, 2023Universal Morphology Control via Contextual Modulation Nov 23, 2023Annotation Sensitivity: Training Data Collection Methods Affect Model Performance Feb 11, 2025A Survey of In-Context Reinforcement Learning Aug 23, 2019Stackelberg Punishment and Bully-Proofing Autonomous Vehicles Sep 22, 2022An Investigation of the Bias-Variance Tradeoff in Meta-Gradients Feb 9, 2024Distilling Morphology-Conditioned Hypernetworks for Efficient Universal Morphology Control Dec 1, 2021On the Practical Consistency of Meta-Reinforcement Learning Algorithms Jan 31, 2022Trust Region Bounds for Decentralized PPO Under Non-stationarity Dec 20, 2024Cracking the Code: Evaluating Zero-Shot Prompting Methods for Providing Programming Feedback