"au:"Sixiao Zheng"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Sixiao Zheng"" — arXiv2 Search

Showing 1–14 of 14 results

/ Date/ Name

Jan 8, 2026VerseCrafter: Dynamic Realistic Video World Model with 4D Geometric Control Feb 11, 2025VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation Feb 20, 2022Clustering by the Probability Distributions from Extreme Value Theory Jul 13, 2024ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context Mar 23, 2021Incrementally Zero-Shot Detection by an Extreme Value Analyzer Dec 31, 2020Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers Feb 24, 2024Intelligent Director: An Automatic Framework for Dynamic Visual Composition using ChatGPT Mar 4, 2018Could Interaction with Social Robots Facilitate Joint Attention of Children with Autism Spectrum Disorder?Mar 30, 2025ReasonGrounder: LVLM-Guided Hierarchical Feature Splatting for Open-Vocabulary 3D Visual Grounding and Reasoning Jun 4, 2021NMS-Loss: Learning with Non-Maximum Suppression for Crowded Pedestrian Detection Jul 19, 2022Vision Transformers: From Semantic Segmentation to Dense Prediction Jul 9, 2025A Neural Representation Framework with LLM-Driven Spatial Reasoning for Open-Vocabulary 3D Visual Grounding Mar 16, 2026Mind-of-Director: Multi-modal Agent-Driven Film Previsualization via Collaborative Decision-Making Jul 2, 2025TriVLA: A Triple-System-Based Unified Vision-Language-Action Model with Episodic World Modeling for General Robot Control