/ Date/ Name

Computer Vision

cs.CV

/ Date/ Name

/ Date/ Name

Showing 441–460 of 2,609 results

/ Date/ Name

Nov 13, 2025AHA! Animating Human Avatars in Diverse Scenes with Gaussian Splatting Nov 10, 2025Lightning Grasp: High Performance Procedural Grasp Synthesis with Contact Fields Nov 10, 2025StreamDiffusionV2: A Streaming System for Dynamic and Interactive Video Generation Nov 10, 2025StreamKV: Streaming Video Question-Answering with Segment-based KV Cache Retrieval and Compression Nov 10, 2025FoCLIP: A Feature-Space Misalignment Framework for CLIP-Based Image Manipulation and Detection Nov 7, 2025Neural Image Abstraction Using Long Smoothing B-Splines Nov 6, 2025NVIDIA Nemotron Nano V2 VL Nov 4, 2025RxnCaption: Reformulating Reaction Diagram Parsing as Visual Prompt Guided Captioning Nov 1, 2025Challenging DINOv3 Foundation Model under Low Inter-Class Variability: A Case Study on Fetal Brain Ultrasound Oct 31, 2025Phased DMD: Few-step Distribution Matching Distillation via Score Matching within Subintervals Oct 31, 2025RzenEmbed: Towards Comprehensive Multimodal Retrieval Oct 30, 2025Are Video Models Ready as Zero-Shot Reasoners? An Empirical Study with the MME-CoF Benchmark Oct 30, 2025Detecting Unauthorized Vehicles using Deep Learning for Smart Cities: A Case Study on Bangladesh Oct 29, 2025Generative Image Restoration and Super-Resolution using Physics-Informed Synthetic Data for Scanning Tunneling Microscopy Oct 29, 2025Diffusion-Driven Progressive Target Manipulation for Source-Free Domain Adaptation Oct 28, 2025Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and Generation Oct 28, 2025ResNet: Enabling Deep Convolutional Neural Networks through Residual Learning Oct 27, 2025EgoThinker: Unveiling Egocentric Reasoning with Spatio-Temporal CoT Oct 27, 2025Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning Oct 26, 2025IGGT: Instance-Grounded Geometry Transformer for Semantic 3D Reconstruction

← Previous Next →