"au:"Sinan Tan"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Sinan Tan"" — arXiv2 Search

Showing 1–12 of 12 results

/ Date/ Name

Jan 26, 2022Self-supervised 3D Semantic Representation Learning for Vision-and-Language Navigation Jan 26, 2022An Automated Question-Answering Framework Based on Evolution Algorithm Sep 16, 2021Knowledge-based Embodied Question Answering Apr 30, 2020Towards Embodied Scene Description Oct 6, 2022Embodied Referring Expression for Manipulation Question Answering in Interactive Environment Dec 8, 2022OFASys: A Multi-Modal Multi-Task Learning System for Building Generalist Models Sep 18, 2024Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution Dec 1, 2022Mixed Neural Voxels for Fast Multi-view Video Synthesis Aug 24, 2023Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond Sep 28, 2023Qwen Technical Report Oct 2, 2024A Spark of Vision-Language Intelligence: 2-Dimensional Autoregressive Transformer for Efficient Finegrained Image Generation Jul 15, 2024Qwen2 Technical Report