"au:"Byung-Jun Lee"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Byung-Jun Lee"" — arXiv2 Search

Showing 1–20 of 24 results

/ Date/ Name

Jul 30, 2024ARCLE: The Abstraction and Reasoning Corpus Learning Environment for Reinforcement Learning Oct 15, 2024Unsupervised Training of Diffusion Models for Feasible Solution Generation in Neural Combinatorial Optimization Jun 16, 2025K/DA: Automated Data Generation Pipeline for Detoxifying Implicitly Offensive Language in Korean May 16, 2025FALCON: False-Negative Aware Learning of Contrastive Negatives in Vision-Language Alignment Oct 15, 2024Diffusion-Based Offline RL for Improved Decision-Making in Augmented ARC Task Feb 8, 2026Direct Soft-Policy Sampling via Langevin Dynamics Feb 24, 2026ERA: Evidence-based Reliability Alignment for Honest Retrieval-Augmented Generation Jun 21, 2021OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation Oct 24, 2022Local Metric Learning for Off-Policy Evaluation in Contextual Bandits with Continuous Actions Jul 3, 2025Offline Reinforcement Learning with Penalized Action Noise Injection May 16, 2025Prior-Guided Diffusion Planning for Offline Reinforcement Learning Nov 15, 2024Adaptive Non-uniform Timestep Sampling for Accelerating Diffusion Model Training Jun 9, 2025FairDICE: Fairness-Driven Offline Multi-Objective Reinforcement Learning Sep 17, 2025Iterative Prompt Refinement for Safer Text-to-Image Generation Sep 25, 2025Actor-Critic without Actor Jun 10, 2025Semi-gradient DICE for Offline Constrained Reinforcement Learning Sep 26, 2025Beyond RAG vs. Long-Context: Learning Distraction-Aware Retrieval for Efficient Knowledge Grounding Feb 2, 2026TABX: A High-Throughput Sandbox Battle Simulator for Multi-Agent Reinforcement Learning Jan 18, 2024Offline Imitation Learning by Controlling the Effective Planning Horizon Jan 22, 2025NBDI: A Simple and Effective Termination Condition for Skill Extraction from Task-Agnostic Demonstrations