"au:"Yi-Kai Zhang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Yi-Kai Zhang"" — arXiv2 Search

Showing 1–12 of 12 results

/ Date/ Name

Jun 6, 2023Model Spider: Learning to Rank Pre-Trained Models Efficiently Dec 9, 2024OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions Mar 11, 2026$V_{0.5}$: Generalist Value Model as a Prior for Sparse RL Rollouts Aug 17, 2023ZhiJian: A Unifying and Rapidly Deployable Toolbox for Pre-trained Model Reuse Jun 5, 2024Wings: Learning Multimodal LLMs without Text-only Forgetting Mar 27, 2025Model Assembly Learning with Heterogeneous Layer Weight Merging Feb 24, 2025Capability Instruction Tuning: A New Paradigm for Dynamic LLM Routing Feb 3, 2026$V_0$: A Generalist Value Model for Any Policy at State Zero Feb 3, 2026CoBA-RL: Capability-Oriented Budget Allocation for Reinforcement Learning in LLMs Dec 8, 2023Few-Shot Class-Incremental Learning via Training-Free Prototype Calibration Jan 23, 2026LongCat-Flash-Thinking-2601 Technical Report Feb 6, 2026ScaleEnv: Scaling Environment Synthesis from Scratch for Generalist Interactive Tool-Use Agent Training