"au:"Sarah Schwettmann"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Sarah Schwettmann"" — arXiv2 Search

Showing 1–16 of 16 results

/ Date/ Name

Jan 26, 2022Natural Language Descriptions of Deep Visual Features Aug 3, 2023Multimodal Neurons in Pretrained Text-Only Transformers Oct 8, 2021Toward a Visual Concept Vocabulary for GAN Latent Space Apr 22, 2024Automatic Discovery of Visual Circuits Dec 20, 2020Latent Compass: Creation by Navigation Sep 7, 2023FIND: A Function Description Benchmark for Evaluating Interpretability Methods Oct 31, 2024Nearest Neighbor Normalization Improves Multimodal Retrieval Apr 22, 2024A Multimodal Automated Interpretability Agent Feb 3, 2025Eliciting Language Model Behaviors with Investigator Agents Dec 17, 2025Predictive Concept Decoders: Training Scalable End-to-End Interpretability Assistants Nov 19, 2023An Alternative to Regulation: The Case for Public AI Jun 25, 2025The Singapore Consensus on Global AI Safety Research Priorities Jun 5, 2025Line of Sight: On Linear Representations in VLLMs Jan 30, 2026Language Model Circuits Are Sparse in the Neuron Basis Apr 8, 2026ADAG: Automatically Describing Attribution Graphs Jul 3, 2025Establishing Best Practices for Building Rigorous Agentic Benchmarks