"au:"David Grangier"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"David Grangier"" — arXiv2 Search

Showing 1–20 of 62 results

/ Date/ Name

Feb 2, 2024Need a Small Specialized Language Model? Plan Early!May 16, 2018QuaterNet: A Quaternion-based Recurrent Model for Human Motion Sep 5, 2024The AdEMAMix Optimizer: Better, Faster, Older Oct 3, 2024Dynamic Gradient Alignment for Online Data Mixing Sep 15, 2021On the Complementarity of Data Selection and Fine Tuning for Domain Adaptation Mar 24, 2016Neural Text Generation from Structured Data with Application to the Biography Domain Dec 15, 2015Strategies for Training Large Vocabulary Neural Language Models Nov 14, 2022High-Resource Methodological Bias in Low-Resource Investigations Oct 20, 2020Human-Paraphrased References Improve Neural Machine Translation Nov 14, 2017Classical Structured Prediction Losses for Sequence to Sequence Learning Jun 1, 2018Scaling Neural Machine Translation Apr 29, 2021Experts, Errors, and Context: A Large-Scale Study of Human Evaluation for Machine Translation Sep 21, 2021The Trade-offs of Domain Adaptation for Neural Language Models Sep 16, 2014ICE: Enabling Non-Experts to Build Models Interactively for Large-Scale Lopsided Problems Nov 20, 2023Adaptive Training Distributions with Scalable Online Bilevel Optimization Nov 14, 2017Controllable Abstractive Summarization Nov 13, 2017QuickEdit: Editing Text & Translations by Crossing Words Out Feb 3, 2025Soup-of-Experts: Pretraining Specialist Models via Parameters Averaging Sep 30, 2024Task-Adaptive Pretrained Language Models via Clustered-Importance Sampling Nov 10, 2023Transfer Learning for Structured Pruning under Limited Task Data