"au:"Kate Saenko"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Kate Saenko"" — arXiv2 Search

Showing 1–13 of 13 results

/ Date/ Name

Dec 11, 2025Mull-Tokens: Modality-Agnostic Latent Thinking Mar 17, 2025Web Artifact Attacks Disrupt Vision Language Models Dec 10, 2024SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models Dec 3, 2023Learning to Compose SuperWeights for Neural Parameter Allocation Search Aug 8, 2023From Fake to Real: Pretraining on Balanced Synthetic Images to Prevent Spurious Correlations in Image Recognition Mar 28, 2023Language-Guided Audio-Visual Source Separation via Trimodal Consistency Jul 26, 2022NewsStories: Illustrating articles with visual summaries Feb 10, 2022The Abduction of Sherlock Holmes: A Dataset for Visual Abductive Reasoning Apr 17, 2021Mobile App Tasks with Iterative Feedback (MoTIF): Addressing Task Feasibility in Interactive Visual Environments Sep 8, 2019MULE: Multimodal Universal Language Embedding Aug 17, 2019Language Features Matter: Effective Language Representations for Vision-Language Tasks May 26, 2019Why do These Match? Explaining the Behavior of Image Similarity Models Nov 17, 2018Revisiting Image-Language Networks for Open-ended Phrase Detection