"au:"Chao Fang"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Chao Fang"" — arXiv2 Search

Showing 1–20 of 59 results

/ Date/ Name

Jan 30, 2024A Scalable RISC-V Vector Processor Enabling Efficient Multi-Precision DNN Inference Nov 10, 2025P3-LLM: An Integrated NPU-PIM Accelerator for LLM Inference Using Hybrid Numerical Formats May 28, 2025Efficient Precision-Scalable Hardware for Microscaling (MX) Processing in Robotics Learning Nov 9, 2025Precision-Scalable Microscaling Datapaths with Optimized Reduction Tree for Efficient NPU Integration Jan 13, 2020Hybrid Precoding in Cooperative Millimeter Wave Networks Jan 22, 2024BETA: Binarized Energy-Efficient Transformer Accelerator at the Edge Aug 26, 2025APT-LLM: Exploiting Arbitrary-Precision Tensor Core Computing for LLM Acceleration Jan 7, 2026A Scheduling Framework for Efficient MoE Inference on Edge GPU-NDP Systems Feb 3, 2023PDPU: An Open-Source Posit Dot-Product Unit for Deep Learning Applications Sep 21, 2024SPEED: A Scalable RISC-V Vector Processor Enabling Efficient Multi-Precision DNN Inference Sep 26, 2024Efficient Arbitrary Precision Acceleration for Large Language Models on GPU Tensor Cores Feb 27, 2025A Novel P-bit-based Probabilistic Computing Approach for Solving the 3-D Protein Folding Problem May 25, 2025Enable Lightweight and Precision-Scalable Posit/IEEE-754 Arithmetic in RISC-V Cores for Transprecision Computing Jul 16, 2024Co-Designing Binarized Transformer and Hardware Accelerator for Efficient End-to-End Edge Deployment Sep 15, 2023A Precision-Scalable RISC-V DNN Processor with On-Device Learning Capability at the Extreme Edge Sep 22, 2023Efficient N:M Sparse DNN Training Using Algorithm, Architecture, and Dataflow Co-Design Aug 12, 2022An Algorithm-Hardware Co-Optimized Framework for Accelerating N:M Sparse Transformers Jun 6, 2022Crosstalk Suppression in Individually Addressed Two-Qubit Gates in a Trapped-Ion Quantum Computer Jun 4, 2021Joint Scheduling and Throughput Maximization in Self-backhauled Millimeter Wave Cellular Networks Nov 24, 2024Anda: Unlocking Efficient LLM Inference with a Variable-Length Grouped Activation Data Format