"au:"Songming Zhang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Songming Zhang"" — arXiv2 Search

Showing 1–19 of 19 results

/ Date/ Name

May 14, 2023Towards Understanding and Improving Knowledge Distillation for Neural Machine Translation Jun 25, 2024Dual-Space Knowledge Distillation for Large Language Models Dec 25, 2023Mixture Data for Training Cannot Ensure Out-of-distribution Generalization Dec 25, 2023ShiftKD: Benchmarking Knowledge Distillation under Distribution Shift Mar 6, 2022Conditional Bilingual Mutual Information Based Adaptive Training for Neural Machine Translation Apr 15, 2025A Dual-Space Framework for General Knowledge Distillation of Large Language Models Mar 4, 2025AlignDistil: Token-Level Language Model Alignment as Adaptive Policy Distillation Mar 2, 2026KDFlow: A User-Friendly and Efficient Knowledge Distillation Framework for Large Language Models Jun 24, 2024Multilingual Knowledge Editing with Language-Agnostic Factual Neurons Sep 10, 2025CM-Align: Consistency-based Multilingual Alignment for Large Language Models Mar 18, 2026SCALE:Scalable Conditional Atlas-Level Endpoint transport for virtual cell perturbation prediction Oct 8, 2025Think Natively: Unlocking Multilingual Reasoning with Consistency-Enhanced Reinforcement Learning Dec 8, 2025M-STAR: Multi-Scale Spatiotemporal Autoregression for Human Mobility Modeling May 28, 2025Less, but Better: Efficient Multilingual Expansion for LLMs via Layer-wise Mixture-of-Experts Apr 30, 2026Benchmarking virtual cell models for in-the-wild perturbation response Dec 27, 2018Kerr-de Sitter and Kerr-anti-de Sitter black holes as accelerators for spinning particles Oct 20, 2023A Quality-based Syntactic Template Retriever for Syntactically-controlled Paraphrase Generation Oct 12, 2022Improved Data Augmentation for Translation Suggestion Oct 26, 2024GATES: Graph Attention Network with Global Expression Fusion for Deciphering Spatial Transcriptome Architectures