"au:"Junshi Huang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Junshi Huang"" — arXiv2 Search

Showing 1–20 of 29 results

/ Date/ Name

May 29, 2015Cross-domain Image Retrieval with a Dual Attribute-aware Ranking Network Aug 7, 2023DiT: Efficient Vision Transformers with Dynamic Token Routing Apr 27, 2021Rethinking BiSeNet For Real-time Semantic Segmentation Jan 13, 2026UM-Text: A Unified Multimodal Model for Image Understanding and Visual Text Editing Oct 5, 2022Meta-Ensemble Parameter Learning Feb 8, 2024Scalable Diffusion Models with State Space Backbone Nov 2, 2023Enriching Phrases with Coupled Pixel and Object Contexts for Panoptic Narrative Grounding Jun 3, 2024Dimba: Transformer-Mamba Diffusion Models Sep 1, 2024FLUX that Plays Music Jan 3, 2025JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing Feb 1, 2023EfficientRep:An Efficient Repvgg-style ConvNets with Hardware-aware Neural Network Design Nov 30, 2022Uncertainty-Aware Image Captioning Apr 20, 2024Music Consistency Models Jul 21, 2023Divide and Adapt: Active Domain Adaptation via Customized Learning Jul 16, 2024Scaling Diffusion Transformers to 16 Billion Parameters Sep 27, 2025Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling Dec 22, 2023Tuning-Free Inversion-Enhanced Control for Consistent Image Editing Nov 27, 2023A-JEPA: Joint-Embedding Predictive Architecture Can Listen Jun 8, 2022Language-Bridged Spatial-Temporal Interaction for Referring Video Object Segmentation Mar 25, 2017More is Less: A More Complicated Network with Less Inference Complexity