"au:"Tongzheng Ren"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Tongzheng Ren"" — arXiv2 Search

Showing 1–20 of 32 results

/ Date/ Name

Mar 3, 2021Combinatorial Bandits without Total Order for Arms Mar 3, 2021Linear Bandit Algorithms with Sublinear Time Complexity Nov 22, 2021A Free Lunch from the Noise: Provable and Practical Exploration for Representation Learning May 16, 2022An Exponentially Increasing Step-size for Parameter Estimation in Statistical Models Dec 17, 2022Latent Variable Representation for Reinforcement Learning Apr 8, 2023Stochastic Nonlinear Control via Finite-dimensional Spectral Dynamic Embedding Jul 14, 2022Making Linear MDPs Practical via Contrastive Representation Learning Mar 13, 2022Policy Learning for Robust Markov Decision Process with a Mismatched Generative Model Oct 15, 2021Towards Statistical and Computational Complexities of Polyak Step Size Gradient Descent Mar 25, 2021Nearly Horizon-Free Offline Reinforcement Learning Nov 18, 2019Implicit Regularization and Convergence for Weight Normalization Aug 19, 2022Spectral Decomposition Representation for Reinforcement Learning Nov 20, 2023Provable Representation with Efficient Planning for Partial Observable Reinforcement Learning Jun 2, 2021Unsupervised Out-of-Domain Detection via Pre-trained Transformers Jun 16, 2021Quasi-Bayesian Dual Instrumental Variable Regression May 27, 2022Efficient Forecasting of Large Scale Hierarchical Time Series via Multilevel Clustering Mar 8, 2024DeepSeek-VL: Towards Real-World Vision-Language Understanding Jul 15, 2024Spectral Representation for Causal Estimation with Hidden Confounders Feb 21, 2020Stein Self-Repulsive Dynamics: Benefits From Past Samples Jan 27, 2019Reward Shaping via Meta-Learning