"au:"Yundi Qian"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Yundi Qian"" — arXiv2 Search

Showing 1–3 of 3 results

/ Date/ Name

Nov 13, 2025AdvancedIF: Rubric-Based Benchmarking and Reinforcement Learning for Advancing LLM Instruction Following Nov 25, 2024Self-Generated Critiques Boost Reward Modeling for Language Models Jul 31, 2024The Llama 3 Herd of Models