"au:"Dhruba Ghosh"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Dhruba Ghosh"" — arXiv2 Search

Showing 1–9 of 9 results

/ Date/ Name

Feb 19, 2026Understanding the Fine-Grained Knowledge Capabilities of Vision-Language Models Oct 17, 2023GenEval: An Object-Focused Framework for Evaluating Text-to-Image Alignment Dec 8, 2021The Effect of Model Size on Worst-Group Generalization Apr 1, 2024Getting it Right: Improving Spatial Consistency in Text-to-Image Models Apr 27, 2023DataComp: In search of the next generation of multimodal datasets Oct 13, 2025Data or Language Supervision: What Makes CLIP Better than DINO?May 13, 2021Are Larger Pretrained Language Models Uniformly Better? Comparing Performance at the Instance Level Jun 17, 2024DataComp-LM: In search of the next generation of training sets for language models May 28, 2024Why are Visually-Grounded Language Models Bad at Image Classification?