"au:"Bilal Kartal"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Bilal Kartal"" — arXiv2 Search

Showing 1–11 of 11 results

/ Date/ Name

Apr 14, 2026Nemotron 3 Super: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning Nov 6, 2025NVIDIA Nemotron Nano V2 VL Apr 1, 2020Work in Progress: Temporally Extended Auxiliary Tasks Jul 26, 2019On Hard Exploration for Reinforcement Learning: a Case Study in Pommerman Jul 25, 2019Action Guidance with MCTS for Deep Reinforcement Learning Jul 24, 2019Terminal Prediction as an Auxiliary Task for Deep Reinforcement Learning Jul 22, 2019Agent Modeling as Auxiliary Task for Deep Reinforcement Learning Apr 20, 2019Skynet: A Top Deep RL Agent in the Inaugural Pommerman Team Competition Apr 10, 2019Safer Deep RL with Shallow MCTS: A Case Study in Pommerman Nov 30, 2018Using Monte Carlo Tree Search as a Demonstrator within Asynchronous Deep RL Oct 12, 2018A Survey and Critique of Multiagent Deep Reinforcement Learning