"au:"Jingqing Ruan"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jingqing Ruan"" — arXiv2 Search

Showing 1–20 of 28 results

/ Date/ Name

Dec 18, 2023Learning Top-k Subtask Planning Tree based on Discriminative Representation Pre-training for Decision Making Apr 12, 2026SCOPE: Signal-Calibrated On-Policy Distillation Enhancement with Dual-Path Adaptive Weighting Jul 28, 2023Learning to Collaborate by Grouping: a Consensus-oriented Strategy for Multi-agent Reinforcement Learning Sep 20, 2021Learning Multi-agent Action Coordination via Electing First-move Agent May 27, 2024CoSLight: Co-optimizing Collaborator Selection and Decision-making to Enhance Traffic Signal Control Aug 7, 2023TPTU: Large Language Model-based AI Agents for Task Planning and Tool Usage Jan 17, 2022GCS: Graph-based Coordination Strategy for Multi-Agent Reinforcement Learning Jul 2, 2025Reasoner for Real-World Event Detection: Scaling Reinforcement Learning via Adaptive Perplexity-Aware Sampling Strategy Dec 22, 2023DuaLight: Enhancing Traffic Signal Control by Leveraging Scenario-Specific and Scenario-Shared Knowledge May 21, 2025When to Continue Thinking: Adaptive Thinking Mode Switching for Efficient Reasoning May 4, 2023Explainable Reinforcement Learning via a Causal World Model Nov 19, 2023TPTU-v2: Boosting Task Planning and Tool Usage of Large Language Model-based Agents in Real-world Systems May 21, 2024Learning Causal Dynamics Models in Object-Oriented Environments May 10, 2023Mixture of personality improved Spiking actor network for efficient multi-agent cooperation Jul 15, 2024GuideLight: "Industrial Solution" Guidance for More Practical Traffic Signal Control Agents Oct 13, 2025Revisiting Entropy Regularization: Adaptive Coefficient Unlocks Its Potential for LLM Reinforcement Learning Oct 28, 2023Reboost Large Language Model-based Text-to-SQL, Text-to-Python, and Text-to-Function -- with Real Applications in Traffic Domain Mar 2, 2026Harmonizing Dense and Sparse Signals in Multi-turn RL: Dual-Horizon Credit Assignment for Industrial Sales Agents Nov 23, 2023Controlling Large Language Model-based Agents for Large-Scale Decision-Making: An Actor-Critic Approach Jul 22, 2023Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs