"au:"Xinlei Chen"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Xinlei Chen"" — arXiv2 Search

Showing 1–20 of 20 results

/ Date/ Name

Jun 13, 2024An Image is Worth More Than 16x16 Patches: Exploring Transformers on Individual Pixels Feb 15, 2024Revisiting Feature Prediction for Learning Visual Representations from Video Jan 25, 2024Deconstructing Denoising Diffusion Models for Self-Supervised Learning Jun 8, 2023R-MAE: Regions Meet Masked Autoencoders Jan 2, 2023ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders Nov 23, 2022EurNet: Efficient Multi-Range Relational Modeling of Spatial Multi-Relational Data Apr 1, 2022On the Importance of Asymmetry for Siamese Representation Learning Mar 10, 2022LoopITR: Combining Dual and Cross Encoder Architectures for Image-Text Retrieval Nov 22, 2021Benchmarking Detection Transfer Learning with Vision Transformers Oct 11, 2021Towards Demystifying Representation Learning with Non-contrastive Self-supervision Apr 5, 2021An Empirical Study of Training Self-Supervised Vision Transformers Nov 20, 2020Exploring Simple Siamese Representation Learning Mar 9, 2020Improved Baselines with Momentum Contrastive Learning Apr 9, 2019Multi-Target Embodied Question Answering Mar 28, 2019TensorMask: A Foundation for Dense Object Segmentation Mar 29, 2018Iterative Visual Reasoning Beyond Convolutions Apr 13, 2017Spatial Memory for Context Reasoning in Object Detection Feb 7, 2017An Implementation of Faster RCNN with Study for Region Sampling May 7, 2015Webly Supervised Learning of Convolutional Networks Nov 20, 2014Learning a Recurrent Visual Representation for Image Caption Generation