"au:"Ameya Mahabaleshwarkar"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Ameya Mahabaleshwarkar"" — arXiv2 Search

Showing 1–16 of 16 results

/ Date/ Name

Feb 26, 2024Nemotron-4 15B Technical Report Nov 20, 2025Nemotron Elastic: Towards Efficient Many-in-One Reasoning LLMs Apr 15, 2025Minitron-SSM: Efficient Hybrid Language Model Compression through Group-Aware SSM Pruning Apr 4, 2025Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models Nov 20, 2024Hymba: A Hybrid-head Architecture for Small Language Models Jun 17, 2024Nemotron-4 340B Technical Report Apr 14, 2026Nemotron 3 Super: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning Apr 26, 2025When2Call: When (not) to Call Tools Nov 6, 2025NVIDIA Nemotron Nano V2 VL May 2, 2025Llama-Nemotron: Efficient Reasoning Models Jan 27, 2026Quantization-Aware Distillation for NVFP4 Inference Accuracy Recovery Jun 4, 2025Orak: A Foundational Benchmark for Training and Evaluating LLM Agents on Diverse Video Games Aug 21, 2024LLM Pruning and Distillation in Practice: The Minitron Approach Aug 20, 2025NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model Dec 24, 2025NVIDIA Nemotron 3: Efficient and Open Intelligence Dec 23, 2025Nemotron 3 Nano: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning