"au:"Jiaming Zhou"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jiaming Zhou"" — arXiv2 Search

Showing 1–20 of 61 results

/ Date/ Name

Sep 27, 2024ChildMandarin: A Comprehensive Mandarin Speech Dataset for Young Children Aged 3-5 Jun 20, 2024Mitigating the Human-Robot Domain Discrepancy in Visual Pre-training for Robotic Manipulation Feb 22, 2023MADI: Inter-domain Matching and Intra-domain Discrimination for Cross-domain Speech Recognition Sep 19, 2024Enhancing Logical Reasoning in Large Language Models through Graph-based Synthetic Data Jul 24, 2025DIFFA: Large Language Diffusion Models Can Listen and Understand Jan 30, 2026DIFFA-2: A Practical Diffusion Large Language Model for General Audio Understanding Nov 28, 2023Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition Jun 6, 2024Improving Zero-Shot Chinese-English Code-Switching ASR with kNN-CTC and Gated Monolingual Datastores Jul 20, 2025Omni-Thinker: Scaling Multi-Task RL in LLMs with Hybrid Reward and Task Scheduling Dec 21, 2023kNN-CTC: Enhancing ASR via Retrieval of CTC Pseudo Labels Feb 26, 2025CS-Dialogue: A 104-Hour Dataset of Spontaneous Mandarin-English Code-Switching Dialogues for Speech Recognition Jan 22, 2024ActionHub: A Large-scale Action Video Description Dataset for Zero-shot Action Recognition Sep 18, 2024M2R-Whisper: Multi-stage and Multi-scale Retrieval Augmentation for Enhancing Whisper May 21, 2025Exploring the Limits of Vision-Language-Action Manipulations in Cross-task Generalization Jul 12, 2024Enhancing Emotion Recognition in Incomplete Data: A Novel Cross-Modal Alignment, Reconstruction, and Refinement Framework Sep 9, 2024Findings of the 2024 Mandarin Stuttering Event Detection and Automatic Speech Recognition Challenge Jul 15, 2024Human-Centric Transformer for Domain Adaptive Action Recognition Nov 19, 2024GLOVER: Generalizable Open-Vocabulary Affordance Reasoning for Task-Oriented Grasping Jan 8, 2026CosyEdit: Unlocking End-to-End Speech Editing Capability from Zero-Shot Text-to-Speech Models Sep 18, 2025Mind the Gap: Data Rewriting for Stable Off-Policy Supervised Fine-Tuning