"au:"Yaodong Yang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Yaodong Yang"" — arXiv2 Search

Showing 1–6 of 6 results

/ Date/ Name

Mar 23, 2025Mitigating Reward Over-Optimization in RLHF via Behavior-Supported Regularization Oct 2, 2024Computing Ex Ante Equilibrium in Heterogeneous Zero-Sum Team Games Jun 20, 2024SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset Mar 1, 2024Leveraging Team Correlation for Approximating Equilibrium in Two-Team Zero-Sum Games Jun 5, 2021MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning Feb 10, 2020Q-value Path Decomposition for Deep Multiagent Reinforcement Learning