"au:"David D. Yao"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"David D. Yao"" — arXiv2 Search

Showing 1–13 of 13 results

/ Date/ Name

Aug 26, 2023Transaction fee mechanism for Proof-of-Stake protocol Jun 21, 2022Polynomial Voting Rules Jan 5, 2006Heavy-Traffic Optimality of a Stochastic Network under Utility-Maximizing Resource Control Feb 3, 2025Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning May 30, 2023Policy Optimization for Continuous Reinforcement Learning Oct 12, 2025Understanding Sampler Stochasticity in Training Diffusion Models for RLHF Sep 4, 2025Diffusion Generative Models Meet Compressed Sensing, with Applications to Imaging and Finance Oct 5, 2024RainbowPO: A Unified Framework for Combining Improvements in Preference Optimization Mar 13, 2025RPO: Fine-Tuning Visual Generative Models via Rich Vision-Language Preferences Sep 12, 2024Scores as Actions: a framework of fine-tuning diffusion models by continuous-time reinforcement learning Sep 17, 2024Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey Jul 26, 2022Trading under the Proof-of-Stake Protocol -- a Continuous-Time Control Approach Jan 28, 2015Matching Supply and Demand in Production-Inventory Systems: Asymptotics and Optimization