"au:"Florian Tramèr"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Florian Tramèr"" — arXiv2 Search

Showing 1–12 of 12 results

/ Date/ Name

Jan 12, 2026Representations of Text and Images Align From Layer One Feb 4, 2025Adversarial ML Problems Are Getting Harder to Solve and to Evaluate Nov 15, 2024Measuring Non-Adversarial Reproduction of Training Data in Large Language Models Oct 17, 2024Persistent Pre-Training Poisoning of LLMs Oct 4, 2024Gradient-based Jailbreak Images for Multimodal Fusion Models Sep 26, 2024An Adversarial Perspective on Machine Unlearning for AI Safety Jun 17, 2024Adversarial Perturbations Cannot Reliably Protect Artists From Generative AI Jun 12, 2024Dataset and Lessons Learned from the 2024 SaTML LLM Capture-the-Flag Competition Apr 22, 2024Competition Report: Finding Universal Jailbreak Backdoors in Aligned LLMs Apr 15, 2024Foundational Challenges in Assuring Alignment and Safety of Large Language Models Nov 24, 2023Universal Jailbreak Backdoors from Poisoned Human Feedback Oct 3, 2022Red-Teaming the Stable Diffusion Safety Filter