"au:"Tomoki Hayashi"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Tomoki Hayashi"" — arXiv2 Search

Showing 1–20 of 42 results

/ Date/ Name

May 12, 2020DiscreTalk: Text-to-Speech as a Machine Translation Problem Oct 15, 2021ESPnet2-TTS: Extending the Edge of TTS Research Apr 14, 2021Non-autoregressive sequence-to-sequence voice conversion Jul 28, 2018Back-Translation-Style Data Augmentation for End-to-End ASR Apr 22, 2018Multi-Head Decoder for End-to-End Speech Recognition Oct 24, 2019ESPnet-TTS: Unified, Reproducible, and Integratable Open Source End-to-End Text-to-Speech Toolkit Dec 17, 2021Discretization and Re-synthesis: an alternative method to solve the Cocktail Party Problem Feb 17, 2022Acoustic Event Detection with Classifier Chains Jan 22, 2023Unsupervised Data Selection for TTS: Using Arabic Broadcast News as a Case Study Nov 27, 2018Refined WaveNet Vocoder for Variational Autoencoder Based Voice Conversion Jul 21, 2019Statistical Voice Conversion with Quasi-Periodic WaveNet Vocoder Mar 26, 2020Non-parallel Voice Conversion System with WaveNet Vocoder and Collapsed Speech Suppression Aug 7, 2020Pretraining Techniques for Sequence-to-Sequence Voice Conversion Sep 13, 2019A Comparative Study on Transformer vs RNN in Speech Applications Jun 11, 2021Anomalous Sound Detection Using a Binary Classification Model and Class Centroids May 25, 2025Serial-OE: Anomalous sound detection based on serial method with outlier exposure capable of using small amounts of anomalous data for training May 2, 2019Investigation of F0 conditioning and Fully Convolutional Networks in Variational Autoencoder based Voice Conversion Oct 26, 2020Recent Developments on ESPnet Toolkit Boosted by Conformer Jul 24, 2019Non-Parallel Voice Conversion with Cyclic Variational Autoencoder May 18, 2020Quasi-Periodic Parallel WaveGAN Vocoder: A Non-autoregressive Pitch-dependent Dilated Convolution Model for Parametric Speech Generation