"au:"Weiyun Wang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Weiyun Wang"" — arXiv2 Search

Showing 1–5 of 5 results

/ Date/ Name

Oct 14, 2025MetaCaptioner: Towards Generalist Visual Captioning with Open-source Suites Oct 13, 2025Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning Aug 25, 2025InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency Jul 19, 2025Docopilot: Improving Multimodal Models for Document-Level Understanding Jun 12, 2024OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text