"au:"Takaaki Hori"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Takaaki Hori"" — arXiv2 Search

Showing 1–20 of 42 results

/ Date/ Name

Aug 8, 2018End-to-end Speech Recognition with Word-based RNN Language Models Nov 2, 2018Cycle-consistency training for end-to-end speech recognition Apr 19, 2021Advanced Long-context End-to-end Speech Recognition Using Context-expanded Transformers Jan 16, 2025Delayed Fusion: Integrating Large Language Models into First-Pass Decoding in End-to-end Speech Recognition Jun 8, 2017Advances in Joint CTC-Attention based End-to-End Speech Recognition with a Deep CNN Encoder and RNN-LM May 15, 2018A Purely End-to-end System for Multi-speaker Speech Recognition Apr 30, 2019Semi-supervised Sequence-to-sequence ASR using Unpaired Speech and Text Jul 28, 2018Back-Translation-Style Data Augmentation for End-to-End ASR Nov 12, 2018Multi-encoder multi-resolution framework for end-to-end speech recognition Nov 7, 2018Analysis of Multilingual Sequence-to-Sequence speech recognition systems Nov 7, 2018CNN-based MultiChannel End-to-End Speech Recognition for everyday home environments Nov 26, 2020Unsupervised Domain Adaptation for Speech Recognition via Uncertainty Driven Self-Training Oct 11, 2021Advancing Momentum Pseudo-Labeling with Conformer and Initialization Strategy Mar 30, 2018ESPnet: End-to-End Speech Processing Toolkit Jan 11, 2017Attention-Based Multimodal Fusion for Video Description Nov 12, 2018Stream attention-based multi-array end-to-end speech recognition Nov 12, 2018Vectorization of hypotheses and speech for faster beam search in encoder decoder-based speech recognition Apr 7, 2021Capturing Multi-Resolution Context by Dilated Self-Attention Sep 21, 2016Joint CTC-Attention based End-to-End Speech Recognition using Multi-task Learning Nov 1, 2024Optimizing Contextual Speech Recognition Using Vector Quantization for Efficient Retrieval