"au:"Wenwen Tong"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Wenwen Tong"" — arXiv2 Search

Showing 1–5 of 5 results

/ Date/ Name

Oct 15, 2025InteractiveOmni: A Unified Omni-modal Model for Audio-Visual Multi-turn Dialogue Dec 30, 2025SenseNova-MARS: Empowering Multimodal Agentic Reasoning and Search via Reinforcement Learning Mar 18, 20233D Data Augmentation for Driving Scenes on Camera Jun 5, 2023Scene as Occupancy Apr 25, 2024How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites