"au:"Xiaodan Liang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Xiaodan Liang"" — arXiv2 Search

Showing 1–13 of 13 results

/ Date/ Name

Sep 6, 2024Qihoo-T2X: An Efficient Proxy-Tokenized Diffusion Transformer for Text-to-Any-Task Jul 8, 2024Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation Dec 5, 2023DreamVideo: High-Fidelity Image-to-Video Generation with Image Retention and Text Guidance Aug 31, 2023Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using only Images Aug 22, 2023GrowCLIP: Data-aware Automatic Model Growing for Large-scale Contrastive Language-Image Pre-training Apr 10, 2023DetCLIPv2: Scalable Open-Vocabulary Object Detection Pre-training via Word-Region Alignment Dec 2, 20223D-TOGO: Towards Text-Guided Cross-Category 3D Object Generation Feb 17, 2022Revisiting Over-smoothing in BERT from the Perspective of Graph Feb 14, 2022Wukong: A 100 Million Large-scale Chinese Cross-modal Pre-training Benchmark Aug 7, 2021NASOA: Towards Faster Task-oriented Online Fine-tuning with a Zoo of Models Jun 21, 2021SODA10M: A Large-Scale 2D Self/Semi-Supervised Object Detection Dataset for Autonomous Driving Feb 25, 2021SparseBERT: Rethinking the Importance Analysis in Self-attention Jul 18, 2020CATCH: Context-based Meta Reinforcement Learning for Transferrable Architecture Search