"au:"Shuai Wang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Shuai Wang"" — arXiv2 Search

Showing 1–20 of 25 results

/ Date/ Name

Apr 4, 2026Measuring the Permission Gate: A Stress-Test Evaluation of Claude Code's Auto Mode Mar 31, 2026SkillReducer: Optimizing LLM Agent Skills for Token Efficiency Mar 22, 2026WARBENCH: A Comprehensive Benchmark for Evaluating LLMs in Military Decision-Making Jan 26, 2026VIBEVOICE-ASR Technical Report Jan 5, 2026NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation Dec 15, 2025Seedance 1.5 pro: A Native Audio-Visual Joint Generation Foundation Model Nov 13, 2025Time-Layer Adaptive Alignment for Speaker Similarity in Flow-Matching Based Zero-Shot TTS Sep 6, 2025Red-Teaming Coding Agents from a Tool-Invocation Perspective: An Empirical Security Assessment Jun 20, 2025Differentiation-Based Extraction of Proprietary Data from Fine-Tuned LLMs Jun 11, 2025Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models Apr 10, 2025Seed1.5-Thinking: Advancing Superb Reasoning Models with Reinforcement Learning Mar 23, 2025STShield: Single-Token Sentinel for Real-Time Jailbreak Detection in Large Language Models Aug 15, 2024API-guided Dataset Synthesis to Finetune Large Code Models Jun 8, 2024SelfDefend: LLMs Can Defend Themselves against Jailbreaking in a Practical Manner Jan 27, 2024An Empirical Study on Large Language Models in Accuracy and Robustness under Chinese Industrial Scenarios Dec 7, 2023VRPTEST: Evaluating Visual Referring Prompting in Large Multimodal Models Oct 10, 2023Benchmarking and Explaining Large Language Model-based Code Generation: A Causality-Centric Approach Oct 10, 2023Refining Decompiled C Code with Large Language Models Sep 29, 2023Split and Merge: Aligning Position Biases in LLM-based Evaluators Sep 25, 2023AutoPrep: An Automatic Preprocessing Framework for In-the-Wild Speech Data