"au:"Song Han"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Song Han"" — arXiv2 Search

Showing 1–20 of 29 results

/ Date/ Name

Apr 8, 2026Fast-dVLM: Efficient Block-Diffusion VLM via Direct Conversion from Autoregressive VLM Apr 6, 2026TriAttention: Efficient Long Reasoning with Trigonometric KV Compression Feb 19, 2026Stable Asynchrony: Variance-Controlled Off-Policy RL for LLMs Jan 20, 2026Jet-RL: Enabling On-Policy FP8 Reinforcement Learning with Unified Training and Rollout Precision Flow Nov 10, 2025StreamDiffusionV2: A Streaming System for Dynamic and Interactive Video Generation Nov 6, 2025NVIDIA Nemotron Nano V2 VL Jun 19, 2025SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity May 28, 2025Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding Dec 5, 2024NVILA: Efficient Frontier Visual Language Models Oct 25, 2024COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training Oct 14, 2024SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers Sep 6, 2024VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation Jul 26, 2024Wolf: Dense Video Captioning with a World Summarization Framework Jul 24, 2024VILA$^2$: VILA Augmented VILA Mar 28, 2024Tiny Machine Learning: Progress and Futures Oct 26, 2023PockEngine: Sparse and Efficient Fine-tuning in a Pocket Dec 16, 2022Biomedical image analysis competitions: The state of current participation practice Oct 30, 2022QuEst: Graph Transformer for Quantum Circuit Reliability Estimation Jun 30, 2022On-Device Training Under 256KB Memory Jun 19, 2022MME-CRS: Multi-Metric Evaluation Based on Correlation Re-Scaling for Evaluating Open-Domain Dialogue