"au:"Jiangning Zhang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jiangning Zhang"" — arXiv2 Search

Showing 21–40 of 150 results

/ Date/ Name

Mar 26, 2024DiffFAE: Advancing High-fidelity One-shot Facial Appearance Editing with Space-sensitive Customization and Semantic Preservation Jun 4, 2024M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising Mar 1, 2024Point Cloud Mamba: Point Cloud Learning via State Space Model Jun 17, 2024CustAny: Customizing Anything from A Single Example Aug 1, 2023PVG: Progressive Vision Graph for Vision Recognition Mar 10, 2023Iterative Few-shot Semantic Segmentation from Image Label Text Mar 14, 2023Calibrated Teacher for Sparsely Annotated Object Detection May 24, 2024PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning Aug 6, 2024MDT-A2G: Exploring Masked Diffusion Transformers for Co-Speech Gesture Generation Jul 7, 2025Semantic Frame Interpolation Jun 9, 2025PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement Oct 21, 2025UltraGen: High-Resolution Video Generation with Hierarchical Attention Nov 25, 2025Boosting Reasoning in Large Multimodal Models via Activation Replay Dec 25, 2025UltraLBM-UNet: Ultralight Bidirectional Mamba-based Model for Skin Lesion Segmentation Dec 4, 2024DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation Jul 2, 2025Reasoning to Edit: Hypothetical Instruction-Based Image Editing with Visual Reasoning May 24, 2025So-Fake: Benchmarking and Explaining Social Media Image Forgery Detection Jun 16, 2025AdaVideoRAG: Omni-Contextual Adaptive Retrieval-Augmented Efficient Long Video Understanding Jan 9, 2026Towards Generalized Multi-Image Editing for Unified Multimodal Models Jan 31, 2026Dual Latent Memory for Visual Multi-agent System

← Previous Next →