"au:"Tianqi Zhang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Tianqi Zhang"" — arXiv2 Search

Showing 1–2 of 2 results

/ Date/ Name

Apr 10, 2025Seed1.5-Thinking: Advancing Superb Reasoning Models with Reinforcement Learning Jan 25, 2025Predictive Lagrangian Optimization for Constrained Reinforcement Learning