"au:"Satish Nadathur"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Satish Nadathur"" — arXiv2 Search

Showing 1–15 of 15 results

/ Date/ Name

Nov 24, 2018Deep Learning Inference in Facebook Data Centers: Characterization, Performance Optimizations and Hardware Implications Feb 19, 2015Scalable Bayesian Optimization Using Deep Neural Networks Apr 15, 2016Parallelizing Word2Vec in Shared and Distributed Memory Nov 21, 2015BlackOut: Speeding up Recurrent Neural Network Language Models With Very Large Vocabularies Sep 30, 2011Fast Updates on Read-Optimized Databases Using Multi-Core CPUs Mar 25, 2015GraphMat: High performance graph analytics made productive Jul 27, 2016PANDA: Extreme Scale Parallel K-Nearest Neighbor on Distributed Architectures Aug 17, 2017Deep Learning at 15PF: Supervised and Semi-Supervised Classification for Scientific Data Jan 30, 2026Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction Apr 10, 2017Banshee: Bandwidth-Efficient DRAM Caching Via Software/Hardware Cooperation Jul 8, 2021First-Generation Inference Accelerator Deployment at Facebook May 2, 2018Glow: Graph Lowering Compiler Techniques for Neural Networks Aug 31, 2017Galactos: Computing the Anisotropic 3-Point Correlation Function for 2 Billion Galaxies Nov 18, 2016Parallelizing Word2Vec in Multi-Core and Many-Core Architectures May 26, 2021Low-Precision Hardware Architectures Meet Recommendation Model Inference at Scale