"au:"Tianyu Yu"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Tianyu Yu"" — arXiv2 Search

Showing 1–20 of 26 results

/ Date/ Name

May 27, 2024RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness Jun 23, 2025RLPR: Extrapolating RLVR to General Domains without Verifiers Oct 1, 2023Reformulating Vision-Language Foundation Models and Datasets Towards Universal Multimodal Assistants Sep 16, 2025MiniCPM-V 4.5: Cooking Efficient MLLMs via Architecture, Data, and Training Recipe Apr 30, 2026MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction Dec 1, 2023RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback Aug 21, 2023SeqGPT: An Out-of-the-box Large Language Model for Open Domain Sequence Understanding Mar 9, 2023Knowledge-augmented Few-shot Visual Relation Detection Aug 23, 2023Large Multilingual Models Pivot Zero-Shot Multimodal Learning across Languages Nov 22, 2022Visually Grounded Commonsense Knowledge Acquisition Feb 9, 2023Guttation Monitor: Wearable Guttation Sensor for Plant Condition Monitoring and Diagnosis Aug 3, 2024MiniCPM-V: A GPT-4V Level MLLM on Your Phone Dec 11, 2024Euclid: Supercharging Multimodal LLMs with Synthetic High-Fidelity Visual Descriptions Jan 5, 2026Thinking with Blueprints: Assisting Vision-Language Models in Spatial Reasoning via Structured Object Representation Jan 21, 2026The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models Jul 27, 2023MESED: A Multi-modal Entity Set Expansion Dataset with Fine-grained Semantic Classes and Hard Negative Entities Apr 16, 2022Contrastive Learning with Hard Negative Entities for Entity Set Expansion Jul 24, 2024AI-Gadget Kit: Integrating Swarm User Interfaces with LLM-driven Agents for Rich Tabletop Game Applications Feb 3, 2025Process Reinforcement through Implicit Rewards Jan 21, 2025EmbodiedEval: Evaluate Multimodal LLMs as Embodied Agents