"au:"Chen Zhang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Chen Zhang"" — arXiv2 Search

Showing 1–15 of 15 results

/ Date/ Name

Apr 24, 2026UniSonate: A Unified Model for Speech, Music, and Sound Effect Generation with Text Instructions Mar 26, 2026Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale Aug 28, 2025NPG-Muse: Scaling Long Chain-of-Thought Reasoning with NP-Hard Graph Problems Aug 1, 2025AudioGen-Omni: A Unified Multimodal Diffusion Transformer for Video-Synchronized Audio, Speech, and Song Generation Jul 17, 2025Apple Intelligence Foundation Language Models: Tech Report 2025 Jun 24, 2025Kling-Foley: Multimodal Diffusion Transformer for High-Quality Video-to-Audio Generation Oct 23, 2023An Aluminum-coated sCMOS sensor for X-Ray Astronomy May 14, 2023REMAST: Real-time Emotion-based Music Arrangement with Soft Transition Mar 15, 2023Investigating the image lag of a scientific CMOS sensor in X-ray detection Nov 1, 2022SDMuse: Stochastic Differential Music Editing and Generation via Hybrid Representation Sep 30, 2022X-ray performance of a customized large-format scientifc CMOS detector Mar 25, 2022Automatic Song Translation for Tonal Languages Sep 20, 2021TeleMelody: Lyric-to-Melody Generation with a Template-Based Two-Stage Method Sep 16, 2021PDAugment: Data Augmentation by Pitch and Duration Adjustments for Automatic Lyrics Transcription Jun 14, 2020UWSpeech: Speech to Speech Translation for Unwritten Languages