"au:"Dawei Leng"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Dawei Leng"" — arXiv2 Search

Showing 1–14 of 14 results

/ Date/ Name

Mar 19, 2026RPiAE: A Representation-Pivoted Autoencoder Enhancing Both Image Generation and Editing Oct 31, 2025RzenEmbed: Towards Comprehensive Multimodal Retrieval Oct 13, 2025FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment Model Aug 20, 2025CTA-Flux: Integrating Chinese Cultural Semantics into High-Quality English Text-to-Image Communities Aug 14, 2025NanoControl: A Lightweight Framework for Precise and Efficient Control in Diffusion Transformer Aug 7, 2025FLUX-Makeup: High-Fidelity, Identity-Consistent, and Robust Makeup Transfer via Diffusion Transformer Jul 24, 2025LMM-Det: Make Large Multimodal Models Excel in Object Detection May 8, 2025FG-CLIP: Fine-Grained Visual and Textual Alignment Mar 13, 2025PlanGen: Towards Unified Layout Planning and Image Generation in Auto-Regressive Vision Language Models Mar 12, 2025NAMI: Efficient Image Generation via Bridged Progressive Rectified Flow Transformers Mar 11, 2025U-StyDiT: Ultra-high Quality Artistic Style Transfer Using Diffusion Transformers Sep 6, 2024Qihoo-T2X: An Efficient Proxy-Tokenized Diffusion Transformer for Text-to-Any-Task Aug 23, 2024IAA: Inner-Adaptor Architecture Empowers Frozen Large Language Model with Multimodal Capabilities Sep 2, 2023Bridge Diffusion Model: Bridge Chinese Text-to-Image Diffusion Model with English Communities