"au:"Chunyu Wang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Chunyu Wang"" — arXiv2 Search

Showing 21–40 of 64 results

/ Date/ Name

Dec 18, 2023VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder Apr 16, 2025InstantCharacter: Personalize Any Characters with a Scalable Diffusion Transformer Framework Sep 28, 2025HunyuanImage 3.0 Technical Report Jan 16, 2026Image-Text Knowledge Modeling for Unsupervised Multi-Scenario Person Re-Identification Sep 4, 2025PromptEnhancer: A Simple Approach to Enhance Text-to-Image Models via Chain-of-Thought Prompt Rewriting Feb 6, 2026ChatUMM: Robust Context Tracking for Conversational Interleaved Generation Apr 22, 2024Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone Mar 3, 2022Correlation-Aware Deep Tracking Nov 2, 2021Relational Self-Attention: What's Missing in Attention for Video Understanding May 6, 2025Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning Dec 23, 2025YCB-Handovers Dataset: Analyzing Object Weight Impact on Human Handovers to Adapt Robotic Handover Motion Apr 6, 2026Hierarchical SVG Tokenization: Learning Compact Visual Programs for Scalable Vector Graphics Modeling Apr 27, 2026Meta-CoT: Enhancing Granularity and Generalization in Image Editing Nov 30, 2021MMPTRACK: Large-scale Densely Annotated Multi-camera Multiple People Tracking Benchmark Jul 31, 2022One-Shot Medical Landmark Localization by Edge-Guided Transform and Noisy Landmark Refinement Aug 7, 2022Robust Multi-Object Tracking by Marginal Inference Dec 11, 2020A Multi-task Joint Framework for Real-time Person Search Nov 30, 2023MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation Nov 30, 2023ART$\boldsymbol{\cdot}$V: Auto-Regressive Text-to-Video Generation with Diffusion Models Jul 9, 2024RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models

← Previous Next →