"au:"Niklas Muennighoff"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Niklas Muennighoff"" — arXiv2 Search

Showing 1–13 of 13 results

/ Date/ Name

Jan 17, 2026Terminal-Bench: Benchmarking Agents on Hard, Realistic Tasks in Command Line Interfaces Feb 19, 2025MMTEB: Massive Multilingual Text Embedding Benchmark Jan 24, 2025Humanity's Last Exam Jul 20, 2024Consent in Crisis: The Rapid Decline of the AI Data Commons Jun 14, 2024SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages Feb 29, 2024StarCoder 2 and The Stack v2: The Next Generation Feb 12, 2024Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model Nov 3, 2023FinGPT: Large Generative Models for a Small Language Oct 25, 2023The Data Provenance Initiative: A Large Scale Audit of Dataset Licensing & Attribution in AI Aug 14, 2023OctoPack: Instruction Tuning Code Large Language Models May 25, 2023Scaling Data-Constrained Language Models Nov 9, 2022BLOOM: A 176B-Parameter Open-Access Multilingual Language Model Oct 13, 2022MTEB: Massive Text Embedding Benchmark