"au:"Swastik Roy"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Swastik Roy"" — arXiv2 Search

Showing 1–6 of 6 results

/ Date/ Name

Oct 20, 2025OPTAGENT: Optimizing Multi-Agent LLM Interactions Through Verbal Reinforcement Learning for Enhanced Reasoning Sep 29, 2025BeyondBench: Contamination-Resistant Evaluation of Reasoning in Language Models Dec 2, 2025SPARK: Stepwise Process-Aware Rewards for Reference-Free Reinforcement Learning Nov 20, 2025JudgeBoard: Benchmarking and Enhancing Small Language Models for Reasoning Evaluation Mar 17, 2025The Amazon Nova Family of Models: Technical Report and Model Card Apr 24, 2026C-MORAL: Controllable Multi-Objective Molecular Optimization with Reinforcement Alignment for LLMs