cs.DC — arXiv2

Jul 15, 2021MXDAG: A Hybrid Abstraction for Cluster Applications

Jul 15, 2021Improving I/O Performance for Exascale Applications through Online Data Layout Reorganization

Jul 4, 2021KAISA: An Adaptive Second-Order Optimizer Framework for Deep Neural Networks

Jun 11, 2021Bandwidth-Optimal Random Shuffling for GPUs

May 30, 2021Maximizing Parallelism in Distributed Training for Huge Neural Networks

May 3, 2021Analyzing scientific data sharing patterns for in-network data caching

Apr 16, 2021Sync-Switch: Hybrid Parameter Synchronization for Distributed Deep Learning

Apr 16, 2021Evaluation of Portable Acceleration Solutions for LArTPC Simulation Using Wire-Cell Toolkit

Apr 12, 2021Software-Hardware Co-design for Fast and Scalable Training of Deep Learning Recommendation Models

Apr 11, 2021Shuffler: A Large Scale Data Management Tool for ML in Computer Vision

Mar 28, 2021MergeComp: A Compression Scheduler for Scalable Communication-Efficient Distributed Training

Mar 16, 2021An Efficient Vectorization Scheme for Stencil Computation

Mar 4, 2021Pandemic Drugs at Pandemic Speed: Infrastructure for Accelerating COVID-19 Drug Discovery with Hybrid Machine Learning- and Physics-based Simulations on High Performance Computers

Feb 5, 2021Cache Blocking Technique to Large Scale Quantum Computing Simulation on Supercomputers

Jan 26, 2021C-for-Metal: High Performance SIMD Programming on Intel GPUs

Jan 15, 2021SoftNER: Mining Knowledge Graphs From Cloud Incidents

Jan 14, 2021Towards Practical Adam: Non-Convexity, Convergence Theory, and Mini-Batch Acceleration

Nov 22, 2020TaiJi: Longest Chain Availability with BFT Fast Confirmation

Nov 2, 2020The Persistence of False Memory: Brain in a Vat Despite Perfect Clocks

Oct 30, 2020State sharding model on the blockchain