"au:"Jinxian Qu"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jinxian Qu"" — arXiv2 Search

Showing 1–2 of 2 results

/ Date/ Name

Aug 23, 2025Dream to Chat: Model-based Reinforcement Learning on Dialogues with User Belief Modeling Sep 18, 2024MeTHanol: Modularized Thinking Language Models with Intermediate Layer Thinking, Decoding and Bootstrapping Reasoning