"au:"Alexander Hauptmann"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Alexander Hauptmann"" — arXiv2 Search

Showing 1–20 of 88 results

/ Date/ Name

Jun 2, 2019Unsupervised Bilingual Lexicon Induction from Mono-lingual Multimodal Data Aug 11, 2020Robust Long-Term Object Tracking via Improved Discriminative Model Prediction Aug 31, 2017Video Captioning with Guidance of Multimodal Latent Topics Oct 22, 2024Emphasizing Discriminative Features for Dataset Distillation in Complex Scenarios Aug 18, 2024Combo: Co-speech holistic 3D human motion generation and efficient customizable adaptation in harmony Jul 30, 2020From A Glance to "Gotcha": Interactive Facial Image Retrieval with Progressive Relevance Feedback Jun 5, 2018Focal Visual-Text Attention for Visual Question Answering Dec 4, 2020Spatial-Temporal Alignment Network for Action Recognition and Detection Oct 6, 2020Support-set bottlenecks for video-text representation learning Sep 16, 2019Learning Spatial Awareness to Improve Crowd Counting Nov 29, 2018Perceiving Physical Equation by Observing Visual Scenarios Jul 16, 2016Exploiting Multi-modal Curriculum in Noisy Web Data for Large-scale Concept Learning Jun 17, 2024Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning Jul 17, 2024Multimodal Reranking for Knowledge-Intensive Visual Question Answering Jun 25, 2025Deciphering GunType Hierarchy through Acoustic Analysis of Gunshot Recordings Apr 4, 2020SimAug: Learning Robust Representations from Simulation for Trajectory Prediction Nov 2, 2020Event-Related Bias Removal for Real-time Disaster Events Dec 13, 2019The Garden of Forking Paths: Towards Multi-Future Trajectory Prediction May 26, 2019Technical Report of the Video Event Reconstruction and Analysis (VERA) System -- Shooter Localization, Models, Interface, and Beyond Nov 29, 2018Traffic Danger Recognition With Surveillance Cameras Without Training Data