cs.DC — arXiv2

Feb 19, 2026Collaborative Processing for Multi-Tenant Inference on Memory-Constrained Edge TPUs

Feb 16, 2026Efficient Multi-round LLM Inference over Disaggregated Serving

Feb 12, 2026Legitimate Overrides in Decentralized Protocols

Jan 27, 2026Decentralized Nonsmooth Nonconvex Optimization with Client Sampling

Jan 23, 2026GPU-Accelerated Selected Basis Diagonalization with Thrust for SQD-based Algorithms

Jan 19, 2026SWORD: A Secure LoW-Latency Offline-First Authentication and Data Sharing Scheme for Resource Constrained Distributed Networks

Jan 19, 2026Unleashing Efficient Asynchronous RL Post-Training via Staleness-Constrained Rollout Coordination

Dec 3, 2025VLCs: Managing Parallelism with Virtualized Libraries

Nov 18, 2025FLARE: Adaptive Multi-Dimensional Reputation for Robust Client Reliability in Federated Learning

Nov 11, 2025Parallel Sampling via Autospeculation

Nov 10, 2025Lightning Grasp: High Performance Procedural Grasp Synthesis with Contact Fields

Nov 2, 2025FREESH: Fair, Resource- and Energy-Efficient Scheduling for LLM Serving on Heterogeneous GPUs

Oct 30, 2025Mind the Gap: Revealing Inconsistencies Across Heterogeneous AI Accelerators

Oct 30, 2025FlowMesh: A Service Fabric for Composable LLM Workflows

Oct 30, 2025ReSpec: Towards Optimizing Speculative Decoding in Reinforcement Learning Systems

Oct 29, 2025Multi-Resolution Model Fusion for Accelerating the Convolutional Neural Network Training

Oct 23, 2025Collective Communication for 100k+ GPUs

Oct 3, 2025TridentServe: A Stage-level Serving System for Diffusion Pipelines

Sep 22, 2025Expert-as-a-Service: Towards Efficient, Scalable, and Robust Large-scale MoE Serving

Sep 9, 2025HYLU: Hybrid Parallel Sparse LU Factorization