"au:"Shih-Yang Liu"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Shih-Yang Liu"" — arXiv2 Search

Showing 1–13 of 13 results

/ Date/ Name

Oct 25, 2023LLM-FP4: 4-Bit Floating-Point Quantized Transformers Jan 8, 2026GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization Feb 14, 2024DoRA: Weight-Decomposed Low-Rank Adaptation Oct 16, 2025DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token via Reinforcement Learning Oct 28, 2024EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation Feb 4, 2023Oscillation-free Quantization for Low-bit Vision Transformers Dec 14, 2023CMOSE: Comprehensive Multi-Modality Online Student Engagement Dataset with High-Quality Labels Jul 10, 2024RoLoRA: Fine-tuning Rotated Outlier-free LLMs for Effective Weight-Activation Quantization Nov 20, 2024Hymba: A Hybrid-head Architecture for Small Language Models Jun 12, 2023Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection Apr 10, 2025APSQ: Additive Partial Sum Quantization with Algorithm-Hardware Co-Design Mar 28, 2024Genetic Quantization-Aware Approximation for Non-Linear Operations in Transformers Dec 19, 2025A 28nm 0.22μJ/token memory-compute-intensity-aware CNN-Transformer accelerator with hybrid-attention-based layer-fusion and cascaded pruning for semantic-segmentation