"au:"Lawrence McAfee"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Lawrence McAfee"" — arXiv2 Search

Showing 1–9 of 9 results

/ Date/ Name

Apr 4, 2025Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models Apr 13, 2023Shall We Pretrain Autoregressive Language Models with Retrieval? A Comprehensive Study Oct 11, 2023InstructRetro: Instruction Tuning post Retrieval-Augmented Pretraining Jun 27, 2012Utilizing Static Analysis and Code Generation to Accelerate Neural Networks Oct 4, 2023Retrieval meets Long Context Large Language Models May 10, 2022Reducing Activation Recomputation in Large Transformer Models Aug 20, 2025NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model Dec 24, 2025NVIDIA Nemotron 3: Efficient and Open Intelligence Dec 23, 2025Nemotron 3 Nano: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning