"au:"Bingqi Ma"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Bingqi Ma"" — arXiv2 Search

Showing 1–16 of 16 results

/ Date/ Name

Mar 19, 2026Improving Joint Audio-Video Generation with Cross-Modal Context Learning Aug 8, 2022Rethinking Robust Representation Learning Under Fine-grained Noisy Faces Jun 17, 2024Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models Mar 7, 2024MedFLIP: Medical Vision-and-Language Self-supervised Fast Pre-Training with Masked Autoencoder Apr 19, 2024MoVA: Adapting Mixture of Vision Experts to Multimodal Context Nov 29, 2024Pretrained Reversible Generation as Unsupervised Visual Representation Learning Mar 18, 2026AR-CoPO: Align Autoregressive Video Generation with Contrastive Policy Optimization Oct 25, 2023Towards Large-scale Masked Face Recognition Apr 17, 2022Target-Relevant Knowledge Preservation for Multi-Source Domain Adaptive Object Detection Mar 28, 2025High-Fidelity Diffusion Face Swapping with ID-Constrained Facial Conditioning Dec 12, 2024EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM Dec 15, 2024VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping Apr 15, 2025ADT: Tuning Diffusion Models with Adversarial Supervision Apr 3, 2026Salt: Self-Consistent Distribution Matching with Cache-Aware Training for Fast Video Generation Nov 21, 2025Neighbor GRPO: Contrastive ODE Policy Optimization Aligns Flow Models Aug 28, 2023Institutional mapping and causal analysis of avalanche vulnerable areas based on multi-source data