"au:"Jialin Gao"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jialin Gao"" — arXiv2 Search

Showing 1–20 of 28 results

/ Date/ Name

Oct 2, 2025DisCo-Layout: Disentangling and Coordinating Semantic and Physical Refinement in a Multi-Agent Framework for 3D Indoor Layout Synthesis Aug 9, 2019Relation-Aware Pyramid Network (RapNet) for temporal action proposal Oct 12, 2021Relation-aware Video Reading Comprehension for Temporal Language Grounding Mar 9, 2020Accurate Temporal Action Proposal Generation with Relation-Aware Pyramid Network Nov 24, 2025Rethinking Intermediate Representation for VLM-based Robot Manipulation Nov 19, 2024Faster Multi-GPU Training with PPLL: A Pipeline Parallelism Framework Leveraging Local Learning Jun 1, 2024Advancing Supervised Local Learning Beyond Classification with Long-term Feature Bank Apr 15, 2025LayoutCoT: Unleashing the Deep Reasoning Potential of Large Language Models for Layout Generation Feb 12, 2026PosterOmni: Generalized Artistic Poster Creation via Task Distillation and Unified Reward Feedback Feb 23, 2026PosterReward: Unlocking Accurate Evaluation for High-Quality Graphic Design Generation Jul 22, 2025MAN++: Scaling Momentum Auxiliary Network for Supervised Local Learning in Vision Tasks Nov 23, 2025Beyond Words and Pixels: A Benchmark for Implicit World Knowledge Reasoning in Generative Models Dec 24, 2019Focusing and Diffusion: Bidirectional Attentive Graph Convolutional Networks for Skeleton-based Action Recognition Apr 6, 2023Boundary-Denoising for Video Activity Localization Jun 2, 2025Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency Mar 13, 2025SciVerse: Unveiling the Knowledge Comprehension and Visual Reasoning of LMMs on Multi-modal Scientific Problems Apr 30, 2026LaST-R1: Reinforcing Robotic Manipulation via Adaptive Physical Latent Reasoning Jul 26, 2024From 2D to 3D: AISG-SLA Visual Localization Challenge Aug 6, 2025DOMR: Establishing Cross-View Segmentation via Dense Object Matching Jan 14, 2025LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding