/ Date/ Name

Computer Vision

cs.CV

/ Date/ Name

/ Date/ Name

Showing 661–680 of 2,609 results

/ Date/ Name

May 28, 2025Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions May 28, 2025ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation May 28, 2025Learning World Models for Interactive Video Generation May 28, 2025LiDARDustX: A LiDAR Dataset for Dusty Unstructured Road Environments May 25, 2025DriveX: Omni Scene Modeling for Learning Generalizable World Knowledge in Autonomous Driving May 24, 2025On Denoising Walking Videos for Gait Recognition May 23, 2025DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation May 22, 2025Mesh-RFT: Enhancing Mesh Generation via Fine-grained Reinforcement Fine-Tuning May 22, 2025NTIRE 2025 challenge on Text to Image Generation Model Quality Assessment May 21, 2025UAV-Flow Colosseo: A Real-World Benchmark for Flying-on-a-Word UAV Imitation Learning May 20, 2025Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training May 20, 2025Model-Independent Machine Learning Approach for Nanometric Axial Localization and Tracking May 20, 2025From stability of Langevin diffusion to convergence of proximal MCMC for non-log-concave sampling May 20, 2025Textual Steering Vectors Can Improve Visual Understanding in Multimodal Large Language Models May 19, 2025VSA: Faster Video Diffusion with Trainable Sparse Attention May 19, 2025RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning May 19, 2025Rethinking Features-Fused-Pyramid-Neck for Object Detection May 16, 2025QVGen: Pushing the Limit of Quantized Video Generative Models May 16, 2025PSDiffusion: Harmonized Multi-Layer Image Generation via Layout and Appearance Alignment May 16, 2025From Embeddings to Accuracy: Comparing Foundation Models for Radiographic Classification

← Previous Next →