"au:"Kai Chen"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Kai Chen"" — arXiv2 Search

Showing 1–20 of 22 results

/ Date/ Name

Mar 26, 2026Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale Mar 10, 2026InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing Dec 19, 2025OpenAI GPT-5 System Card Dec 18, 2025PhysBrain: Human Egocentric Data as a Bridge from Vision Language Models to Physical Intelligence Nov 18, 2025ATLAS: A High-Difficulty, Multidisciplinary Benchmark for Frontier Scientific Reasoning Sep 26, 2025MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing Aug 25, 2025InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency Aug 8, 2025gpt-oss-120b & gpt-oss-20b Model Card Jul 7, 2025Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities Mar 25, 2025LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?Mar 3, 2025Building Machine Learning Challenges for Anomaly Detection in Science Dec 21, 2024OpenAI o1 System Card Oct 16, 2024ProSA: Assessing and Understanding the Prompt Sensitivity of LLMs May 20, 2024MathBench: Evaluating the Theory and Application Proficiency of LLMs with a Hierarchical Mathematics Benchmark Mar 26, 2024InternLM2 Technical Report Feb 8, 2024Task-customized Masked AutoEncoder via Mixture of Cluster-conditional Experts Dec 21, 2023T-Eval: Evaluating the Tool Utilization Capability of Large Language Models Step by Step Oct 20, 2023BotChat: Evaluating LLMs' Capabilities of Having Multi-Turn Dialogues Dec 28, 2021TAGPerson: A Target-Aware Generation Pipeline for Person Re-identification Aug 14, 2021MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding