"au:"Craig Boutilier"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Craig Boutilier"" — arXiv2 Search

Showing 1–20 of 20 results

/ Date/ Name

Oct 6, 2023Demystifying Embedding Spaces using Large Language Models May 25, 2023DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models Feb 4, 2023Reinforcement Learning with History-Dependent Dynamic Contexts Feb 6, 2022Discovering Personalized Semantics for Soft Attributes in Recommender Systems using Concept Activation Vectors Feb 11, 2021Meta-Thompson Sampling Feb 8, 2020BRPO: Batch Residual Policy Optimization Nov 20, 2019Gradient-based Optimization for Bayesian Preference Elicitation Sep 26, 2019CAQL: Continuous Action Q-Learning Sep 11, 2019RecSim: A Configurable Simulation Platform for Recommender Systems Jun 21, 2019Randomized Exploration in Generalized Linear Bandits May 29, 2019Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology May 29, 2019Advantage Amplification in Slowly Evolving Latent-State Environments Mar 21, 2019Perturbed-History Exploration in Stochastic Linear Bandits Feb 26, 2019Perturbed-History Exploration in Stochastic Multi-Armed Bandits Oct 4, 2018Seq2Slate: Re-ranking and Slate Optimization with RNNs May 7, 2018Planning and Learning with Stochastic Action Sets Mar 6, 2013The Probability of a Possibility: Adding Uncertainty to Default Rules Jan 23, 2013Continuous Value Function Approximation for Sequential Bidding Policies Jul 11, 2012Regret Minimizing Equilibria and Mechanisms for Games with Strict Type Uncertainty Jun 13, 2011Eliciting Forecasts from Self-interested Experts: Scoring Rules for Decision Makers