"au:"Yuxin Peng"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Yuxin Peng"" — arXiv2 Search

Showing 21–40 of 85 results

/ Date/ Name

Apr 14, 2017Cross-media Similarity Metric Learning with Unified Deep Networks Apr 7, 2017An Overview of Cross-media Retrieval: Concepts, Methodologies, Benchmarks and Challenges Aug 31, 2022SIM-Trans: Structure Information Modeling Transformer for Fine-grained Visual Categorization Sep 25, 2017Fine-grained Discriminative Localization via Saliency-guided Faster R-CNN Aug 31, 2017Fine-grained Visual-textual Representation Learning Aug 16, 2017Modality-specific Cross-modal Similarity Measurement with Recurrent Attention Network Feb 7, 2018Deep Reinforcement Learning for Image Hashing Mar 10, 2018Deep Cross-media Knowledge Transfer Nov 21, 2023Attribute-Aware Deep Hashing with Self-Consistency for Large-Scale Fine-Grained Image Retrieval May 11, 2024FineParser: A Fine-grained Spatio-temporal Action Parser for Human-centric Action Quality Assessment Mar 15, 2023Scanning Only Once: An End-to-end Framework for Fast Temporal Grounding in Long Videos Dec 12, 2024Selective Visual Prompting in Vision Mamba Mar 17, 2025SCAP: Transductive Test-Time Adaptation via Supportive Clique-based Attribute Prompting Jun 15, 2025Balancing Preservation and Modification: A Region and Semantic Aware Metric for Instruction-Based Image Editing Aug 24, 2025Investigating Domain Gaps for Indoor 3D Object Detection Feb 27, 2026Venus: Benchmarking and Empowering Multimodal Large Language Models for Aesthetic Guidance and Cropping Feb 9, 2026TiFRe: Text-guided Video Frame Reduction for Efficient Video Multi-modal Large Language Models Apr 17, 2026Repurposing 3D Generative Model for Autoregressive Layout Generation Sep 7, 2023Efficient Adaptive Human-Object Interaction Detection with Concept-guided Memory Mar 28, 2023PosterLayout: A New Benchmark and Approach for Content-aware Visual-Textual Presentation Layout

← Previous Next →