"au:"Chengkai Hou"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Chengkai Hou"" — arXiv2 Search

Showing 1–18 of 18 results

/ Date/ Name

Aug 24, 20254D Visual Pre-training for Robot Learning Jun 28, 2023Subclass-balancing Contrastive Learning for Long-tailed Recognition Sep 9, 2023When to Learn What: Model-Adaptive Data Augmentation Curriculum Oct 3, 2024Key-Grid: Unsupervised 3D Keypoints Detection using Grid Heatmap Features Dec 31, 2025RoboMIND 2.0: A Multimodal, Bimanual Mobile Manipulation Dataset for Generalizable Embodied Intelligence Jan 2, 2024BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving Jul 2, 2025AC-DiT: Adaptive Coordination Diffusion Transformer for Mobile Manipulation Mar 13, 2025HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model May 17, 2025H2R: A Human-to-Robot Data Augmentation for Robot Pre-training from Videos Sep 26, 2025Orochi: Versatile Biomedical Image Processor Sep 26, 2025WoW: Towards a World omniscient World model Through Embodied Interaction Apr 9, 2026HEX: Humanoid-Aligned Experts for Cross-Embodiment Whole-Body Manipulation Jun 14, 2024DAG-Plan: Generating Directed Acyclic Dependency Graphs for Dual-Arm Cooperative Planning Jun 7, 2025SpikePingpong: Spike Vision-based Fast-Slow Pingpong Robot System Mar 14, 2026URDF-Anything+: Autoregressive Articulated 3D Models Generation for Physical Simulation Jan 8, 2026LaST$_{0}$: Latent Spatio-Temporal Chain-of-Thought for Robotic Vision-Language-Action Model Dec 18, 2024RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation Nov 2, 2025URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model