"au:"Chongjian Ge"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Chongjian Ge"" — arXiv2 Search

Showing 1–20 of 32 results

/ Date/ Name

Mar 17, 2021Disentangled Cycle Consistency for Highly-realistic Virtual Try-On Apr 19, 2023MetaBEV: Solving Sensor Failures for BEV Detection and Map Segmentation Oct 28, 2024CompGS: Unleashing 2D Compositionality for Compositional Text-to-3D via Dynamically Optimizing 3D Gaussians Mar 30, 2023Soft Neighbors are Positive Supporters in Contrastive Visual Representation Learning Nov 26, 2023Advancing Vision Transformers with Group-Mix Attention Oct 11, 2021Revitalizing CNN Attentions via Transformers in Self-Supervised Visual Representation Learning May 26, 2022AdaptFormer: Adapting Vision Transformers for Scalable Visual Recognition Oct 8, 2023InstructDET: Diversifying Referring Object Detection with Generalized Instructions Sep 30, 2023PixArt-$α$: Fast Training of Diffusion Transformer for Photorealistic Text-to-Image Synthesis Jul 5, 2024WOMD-Reasoning: A Large-Scale Dataset for Interaction Reasoning in Driving Oct 6, 2025Character Mixing for Video Generation Sep 4, 2025A Generative Foundation Model for Chest Radiography Dec 3, 2025RELIC: Interactive Video World Model with Long-Horizon Memory Dec 6, 2025Rethinking Training Dynamics in Scale-wise Autoregressive Generation Jul 21, 2021CycleMLP: A MLP-like Architecture for Dense Prediction Feb 25, 2024RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis Nov 24, 2023Large Language Models as Automated Aligners for benchmarking Vision-Language Models Sep 25, 2023Speed Co-Augmentation for Unsupervised Audio-Visual Pre-training Dec 15, 2025DiffusionBrowser: Interactive Diffusion Previews via Multi-Branch Decoders Dec 12, 2025CreativeVR: Diffusion-Prior-Guided Approach for Structure and Motion Restoration in Generative and Real Videos