"au:"Liliang Ren"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Liliang Ren"" — arXiv2 Search

Showing 1–20 of 25 results

/ Date/ Name

Mar 24, 2020A Simple Fix for Convolutional Neural Network via Coordinate Embedding Oct 22, 2018Towards Universal Dialogue State Tracking Jun 11, 2024Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling Sep 2, 2019Scalable and Accurate Dialogue State Tracking via Hierarchical Sequence Generation Jun 19, 2023Sparse Modular Activation for Efficient Sequence Modeling May 4, 2017Recurrent Soft Attention Model for Common Object Recognition Jul 9, 2025Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation Mar 30, 2026Rethinking Language Model Scaling under Transferable Hypersphere Optimization Jun 27, 2023C-PMI: Conditional Pointwise Mutual Information for Turn-level Dialogue Evaluation Oct 23, 2022Language Model Pre-Training with Sparse Latent Typing Dec 5, 2019RoNGBa: A Robustly Optimized Natural Gradient Boosting Training Approach with Leaf Number Clipping Jun 30, 2021HySPA: Hybrid Span Generation for Scalable Text-to-Graph Extraction Apr 15, 2026Shuffle the Context: RoPE-Perturbed Self-Distillation for Long-Context Adaptation Jun 22, 2025Routing Mamba: Scaling State Space Models with Mixture-of-Experts Projection Jan 18, 2025BAP v2: An Enhanced Task Framework for Instruction Following in Minecraft Dialogues Apr 29, 2025Reinforcement Learning for Reasoning in Large Language Models with One Training Example Apr 22, 2024Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone Sep 30, 2025Understanding the Mixture-of-Experts with Nadaraya-Watson Kernel Apr 30, 2025Phi-4-Mini-Reasoning: Exploring the Limits of Small Reasoning Language Models in Math May 22, 2025PaTH Attention: Position Encoding via Accumulating Householder Transformations