"au:"Jason Kuen"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jason Kuen"" — arXiv2 Search

Showing 21–40 of 45 results

/ Date/ Name

Feb 15, 2026LaViDa-R1: Advancing Reasoning for Unified Multimodal Diffusion Language Models Apr 6, 2023TopNet: Transformer-based Object Placement Network for Image Compositing Nov 10, 2022High-Quality Entity Segmentation Apr 22, 2022Unified Pretraining Framework for Document Understanding Mar 27, 2018Dual Attention Matching Network for Context-Aware Feature Sequence based Person Re-Identification Dec 2, 2024XQ-GAN: An Open-source Image Tokenization Framework for Autoregressive Generation Apr 18, 2024SOHES: Self-supervised Open-world Hierarchical Entity Segmentation Sep 15, 2025Image Tokenizer Needs Post-Training Nov 25, 2025HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation Dec 16, 2025Sparse-LaViDa: Sparse Multimodal Discrete Diffusion Language Models Dec 17, 2024LazyDiT: Lazy Learning for the Acceleration of Diffusion Transformers Mar 16, 2026SNCE: Geometry-Aware Supervision for Scalable Discrete Image Generation Aug 17, 2022Text-to-Image Generation via Implicit Visual Guidance and Hypernetwork Dec 9, 2021CA-SSL: Class-Agnostic Semi-Supervised Learning for Detection and Segmentation Jun 7, 2021SelfDoc: Self-Supervised Document Representation Learning Nov 24, 2021Open-Vocabulary Instance Segmentation via Robust Cross-Modal Pseudo-Labeling Sep 14, 2021Multi-Scale Aligned Distillation for Low-Resolution Detection Dec 11, 2025VGent: Visual Grounding via Modular Design for Disentangling Reasoning and Prediction Mar 17, 2026ViT-AdaLA: Adapting Vision Transformers with Linear Attention Mar 20, 2026DiffGraph: An Automated Agent-driven Model Merging Framework for In-the-Wild Text-to-Image Generation

← Previous Next →