"au:"Xinlei Chen"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Xinlei Chen"" — arXiv2 Search

Showing 1–20 of 135 results

/ Date/ Name

Apr 1, 2022On the Importance of Asymmetry for Siamese Representation Learning Apr 13, 2017Spatial Memory for Context Reasoning in Object Detection Jan 25, 2024Deconstructing Denoising Diffusion Models for Self-Supervised Learning Mar 29, 2018Iterative Visual Reasoning Beyond Convolutions Mar 28, 2019TensorMask: A Foundation for Dense Object Segmentation Jun 13, 2024An Image is Worth More Than 16x16 Patches: Exploring Transformers on Individual Pixels May 7, 2015Webly Supervised Learning of Convolutional Networks Feb 7, 2017An Implementation of Faster RCNN with Study for Region Sampling Apr 5, 2021An Empirical Study of Training Self-Supervised Vision Transformers Nov 20, 2014Learning a Recurrent Visual Representation for Image Caption Generation Nov 20, 2020Exploring Simple Siamese Representation Learning Mar 9, 2020Improved Baselines with Momentum Contrastive Learning Apr 9, 2019Multi-Target Embodied Question Answering Nov 22, 2021Benchmarking Detection Transfer Learning with Vision Transformers Oct 11, 2021Towards Demystifying Representation Learning with Non-contrastive Self-supervision Mar 10, 2022LoopITR: Combining Dual and Cross Encoder Architectures for Image-Text Retrieval Jan 2, 2023ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders Nov 23, 2022EurNet: Efficient Multi-Range Relational Modeling of Spatial Multi-Relational Data Jun 8, 2023R-MAE: Regions Meet Masked Autoencoders Feb 15, 2024Revisiting Feature Prediction for Learning Visual Representations from Video