"au:"Mohammad Shoeybi"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Mohammad Shoeybi"" — arXiv2 Search

Showing 1–20 of 80 results

/ Date/ Name

Jun 13, 2019Unsupervised Video Interpolation Using Cycle Consistency Sep 17, 2019Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism Jan 2, 2021End-to-End Training of Neural Retrievers for Open-Domain Question Answering May 10, 2022Reducing Activation Recomputation in Large Transformer Models Dec 15, 2021Few-shot Instruction Prompts for Pretrained Language Models to Detect Social Biases Oct 6, 2022Prompt Compression and Contrastive Conditioning for Controllability and Toxicity Reduction in Language Models Feb 22, 2020Training Question Answering Models From Synthetic Data Mar 2, 2020Style Example-Guided Text Generation using Generative Adversarial Transformers Dec 25, 2019Neural ODEs for Image Segmentation with Level Sets May 13, 2020Large Scale Multi-Actor Generative Dialog Modeling Apr 9, 2021Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM Jul 5, 2021Long-Short Transformer: Efficient Transformers for Language and Vision Feb 8, 2022Exploring the Limits of Domain-Adaptive Training for Detoxifying Large-Scale Language Models Oct 12, 2022Context Generation Improves Open Domain Question Answering Jan 18, 2024ChatQA: Surpassing GPT-4 on Conversational QA and RAG Nov 13, 2025Music Flamingo: Scaling Music Understanding in Audio Language Models Sep 26, 2025RLP: Reinforcement as a Pretraining Objective Mar 19, 2026Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation Mar 14, 2026MMOU: A Massive Multi-Task Omni Understanding and Reasoning Benchmark for Long and Complex Real-World Videos Jun 9, 2022Factuality Enhanced Language Models for Open-Ended Text Generation