"au:"Shawn Tan"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Shawn Tan"" — arXiv2 Search

Showing 1–20 of 26 results

/ Date/ Name

Oct 9, 2020Recursive Top-Down Production for Sentence Generation with Latent Trees Mar 13, 2024Scattered Mixture-of-Experts Implementation Oct 11, 2023Sparse Universal Transformer Jun 23, 2019Investigating Biases in Textual Entailment Datasets Oct 23, 2024Scaling Stick-Breaking Attention: An Efficient Implementation and In-depth Study Jun 10, 2025The Cell Ontology in the age of single-cell omics Jul 5, 2022Ontology Development Kit: a toolkit for building, maintaining, and standardising biomedical ontologies May 8, 2024Digital Evolution: Novo Nordisk's Shift to Ontology-Based Data Management Jun 18, 2024A framework for developing a knowledge management platform Feb 18, 2026PREFER: An Ontology for the PREcision FERmentation Community Oct 21, 2020Explicitly Modeling Syntax in Language Models with Incremental Parsing and a Dynamic Oracle Jun 7, 2023ModuleFormer: Modularity Emerges from Mixture-of-Experts Dec 23, 2025Distilling to Hybrid Attention Models via KL-Guided Layer Selection Jan 8, 2025A Partition Cover Approach to Tokenization Mar 7, 2018Generating Contradictory, Neutral, and Entailing Sentences Oct 22, 2018Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks Oct 29, 2019Ordered Memory Aug 23, 2024Power Scheduler: A Batch Size and Token Number Agnostic Learning Rate Scheduler Apr 4, 2025Do Larger Language Models Generalize Better? A Scaling Law for Implicit Reasoning at Pretraining Time May 22, 2025PaTH Attention: Position Encoding via Accumulating Householder Transformations