"au:"Zhaorun Chen"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Zhaorun Chen"" — arXiv2 Search

Showing 1–20 of 43 results

/ Date/ Name

Sep 17, 2021POAR: Efficient Policy Optimization via Online Abstract State Representation Learning Nov 5, 2025Scaling Agent Learning via Experience Synthesis Sep 27, 2021Efficiently Training On-Policy Actor-Critic Networks in Robotic Deep Reinforcement Learning with Demonstration-like Sampled Exploration Mar 26, 2025ShieldAgent: Shielding Agents via Verifiable Safety Policy Reasoning Oct 3, 2025ARMs: Adaptive Red-Teaming Agent against Multimodal Models with Plug-and-Play Attacks Feb 18, 2024AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition May 6, 2026DecodingTrust-Agent Platform (DTap): A Controllable and Interactive Red-Teaming Platform for AI Agents Oct 5, 2023Safe Reinforcement Learning via Hierarchical Adaptive Chance-Constraint Safeguards Dec 9, 2024SafeWatch: An Efficient Safety-Policy Following Video Guardrail Model with Transparent Explanations Jul 5, 2024MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?Jul 17, 2024AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases Feb 3, 2025MJ-VIDEO: Fine-Grained Benchmarking and Rewarding Video Preferences in Video Generation Oct 16, 2024Preference Optimization with Multi-Sample Comparisons Mar 2, 2026Towards Principled Dataset Distillation: A Spectral Distribution Perspective Feb 27, 2024Securing Reliability: A Brief Overview on Enhancing In-Context Learning for Foundation Models May 29, 2025SocialMaze: A Benchmark for Evaluating Social Reasoning in Large Language Models Mar 19, 2025MMDT: Decoding the Trustworthiness and Safety of Multimodal Foundation Models Oct 18, 2024Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment Apr 27, 2025Anyprefer: An Agentic Framework for Preference Data Synthesis Oct 14, 2024MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models