"au:"Ziyuan Huang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Ziyuan Huang"" — arXiv2 Search

Showing 1–20 of 21 results

/ Date/ Name

Apr 8, 2026TC-AE: Unlocking Token Capacity for Deep Compression Autoencoders Mar 6, 2026StruVis: Enhancing Reasoning-based Text-to-Image Generation via Thinking with Structured Vision Oct 28, 2025Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and Generation Oct 23, 2025ARGenSeg: Image Segmentation with Autoregressive Image Generation Model Oct 15, 2025When In Doubt, Abstain: The Impact of Abstention on Strategic Classification Sep 28, 2025HieraTok: Multi-Scale Visual Tokenizer Improves Image Reconstruction and Generation May 5, 2025Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction Jan 14, 2025ADAM: An AI Reasoning and Bioinformatics Model for Alzheimer's Disease Detection and Microbiome-Clinical Data Integration Oct 10, 2024Intuitive interaction flow: A Dual-Loop Human-Machine Collaboration Task Allocation Model and an experimental study Dec 15, 2023SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery Sep 14, 2023Disentangling Spatial and Temporal Learning for Efficient Image-to-Video Transfer Learning Aug 20, 2023Towards Real-World Visual Tracking with Temporal Contexts Dec 9, 2022Physically Plausible Animation of Human Upper Body from a Single Image Nov 28, 2022Progressive Learning without Forgetting Sep 5, 2022RLIP: Relational Language-Image Pre-training for Human-Object Interaction Detection Jul 24, 2022MAR: Masked Autoencoders for Efficient Action Recognition Apr 6, 2022Learning from Untrimmed Videos: Self-Supervised Video Representation Learning with Hierarchical Consistency Mar 3, 2022TCTrack: Temporal Contexts for Aerial Tracking Aug 24, 2021ParamCrop: Parametric Cubic Cropping for Video Contrastive Learning Jun 15, 2021Relation Modeling in Spatio-Temporal Action Localization