"au:"Yida Zhao"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Yida Zhao"" — arXiv2 Search

Showing 1–20 of 20 results

/ Date/ Name

Apr 24, 2022Progressive Learning for Image Retrieval with Hybrid-Modality Queries Mar 6, 2023A Redistribution Framework for Diffusion Auctions Jul 24, 2024Dependency Transformer Grammars: Integrating Dependency Structures into Transformer Language Models Oct 28, 2025Repurposing Synthetic Data for Fine-grained Search Agent Supervision Jun 28, 2025A Systematic Study of Compositional Syntactic Transformer Language Models May 28, 2025EvolveSearch: An Iterative Self-Evolving Search Agent Mar 1, 2020Fine-grained Video-Text Retrieval with Hierarchical Graph Reasoning Sep 16, 2025ReSum: Unlocking Long-Horizon Search Intelligence via Context Summarization Mar 11, 2021WenLan: Bridging Vision and Language by Large-Scale Multi-Modal Pre-Training Oct 28, 2025AgentFold: Long-Horizon Web Agents with Proactive Context Management Jun 14, 2020Team RUC_AIM3 Technical Report at Activitynet 2020 Task 2: Exploring Sequential Events Detection for Dense Video Captioning Aug 3, 2020The End-of-End-to-End: A Video Understanding Pentathlon Challenge (2020)Oct 15, 2019Integrating Temporal and Spatial Attentions for VATEX Video Captioning Challenge 2019 Oct 28, 2025Tongyi DeepResearch Technical Report Oct 28, 2025ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking Aug 7, 2025WebWatcher: Breaking New Frontier of Vision-Language Deep Research Agent Sep 16, 2025WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning Jul 11, 2019Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos Jun 22, 2018RUC+CMU: System Report for Dense Captioning Events in Videos Aug 15, 2019Unpaired Cross-lingual Image Caption Generation with Self-Supervised Rewards