"au:"Zelei Cheng"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Zelei Cheng"" — arXiv2 Search

Showing 1–9 of 9 results

/ Date/ Name

May 5, 2024RICE: Breaking Through the Training Bottlenecks of Reinforcement Learning with Explanation Sep 15, 2025Building Coding Agents via Entropy-Enhanced Multi-Turn Preference Optimization Oct 6, 2023TrialView: An AI-powered Visual Analytics System for Temporal Event Data in Clinical Trials Mar 10, 2025UC-MOA: Utility-Conditioned Multi-Objective Alignment for Distributional Pareto-Optimality Feb 6, 2020Mitigating Query-Flooding Parameter Duplication Attack on Regression Models with High-Dimensional Gaussian Mechanism Feb 8, 2025A Survey on Explainable Deep Reinforcement Learning Apr 9, 2026Decomposing the Delta: What Do Models Actually Learn from Preference Pairs?Sep 19, 2025GPO: Learning from Critical Steps to Improve LLM Reasoning Oct 18, 2024Soft-Label Integration for Robust Toxicity Classification