"au:"Zihao Wang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Zihao Wang"" — arXiv2 Search

Showing 1–16 of 16 results

/ Date/ Name

Apr 24, 2026Uni-Encoder Meets Multi-Encoders: Representation Before Fusion for Brain Tumor Segmentation with Missing Modalities Apr 2, 2026Director: Instance-aware Gaussian Splatting for Dynamic Scene Modeling and Understanding Dec 7, 2025Multi-Accent Mandarin Dry-Vocal Singing Dataset: Benchmark for Singing Accent Recognition Dec 7, 2025Singing Timbre Popularity Assessment Based on Multimodal Large Foundation Model Dec 2, 2025DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models Nov 12, 2025Diff-V2M: A Hierarchical Conditional Diffusion Model with Explicit Rhythmic Modeling for Video-to-Music Generation Sep 17, 2025Assessing Data Replication in Symbolic Music via Adapted Structural Similarity Index Measure May 22, 2025Losing is for Cherishing: Data Valuation Based on Machine Unlearning and Shapley Value May 11, 2025Seed1.5-VL Technical Report Apr 1, 2025A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives Jan 24, 2025Humanity's Last Exam Jul 3, 2024MuDiT & MuSiT: Alignment with Colloquial Expression in Description-to-Song Generation Feb 15, 2024MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music Sep 19, 2023MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation May 14, 2023REMAST: Real-time Emotion-based Music Arrangement with Soft Transition Feb 3, 2023Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents