"au:"Liu Leqi"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Liu Leqi"" — arXiv2 Search

Showing 1–20 of 38 results

/ Date/ Name

Nov 13, 2020Rebounding Bandits for Modeling Satiation Effects Jun 27, 2022Supervised Learning with General Risk Functionals Jul 1, 2021When Curation Becomes Creation: Algorithms, Microcontent, and the Vanishing Distinction between Platforms and Creators Sep 20, 2024A Unified Causal Framework for Auditing Recommender Systems for Ethical Concerns Mar 25, 2022Modeling Attrition in Recommender Systems with Departing Bandits Mar 2, 2021Median Optimal Treatment Regimes Feb 6, 2024Personalized Language Modeling from Personalized Human Feedback May 31, 2025Linear Representation Transferability Hypothesis: Leveraging Small Models to Steer Large Models Mar 13, 2024Prompting Fairness: Integrating Causality to Debias Large Language Models Apr 13, 2026Filtered Reasoning Score: Evaluating Reasoning Quality on a Model's Most-Confident Traces Sep 21, 2022Off-Policy Risk Assessment in Markov Decision Processes Oct 12, 2021Action-Sufficient State Representation Learning for Control with Structural Constraints Oct 17, 2024A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement May 28, 2025Learning Composable Chains-of-Thought Dec 12, 2019Game Design for Eliciting Distinguishable Behavior Apr 18, 2021Off-Policy Risk Assessment in Contextual Bandits Mar 4, 2021On the Convergence and Optimality of Policy Gradient for Markov Coherent Risk Apr 22, 2022A Taxonomy of Human and ML Strengths in Decision-Making to Investigate Human-ML Complementarity Apr 16, 2023A Field Test of Bandit Algorithms for Recommendations: Understanding the Validity of Assumptions on Human Preferences in Multi-armed Bandits Jun 17, 2025AgentDistill: Training-Free Agent Distillation with Generalizable MCP Boxes