"au:"Atsuki Yamaguchi"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Atsuki Yamaguchi"" — arXiv2 Search

Showing 1–14 of 14 results

/ Date/ Name

May 18, 2023How does the task complexity of masked pretraining objectives affect downstream performance?Jun 16, 2023How do different tokenizers perform on downstream tasks in scriptio continua languages?: A case study in Japanese Feb 16, 2024An Empirical Study on Cross-lingual Vocabulary Adaptation for Efficient Language Model Inference Jun 17, 2024How Can We Effectively Expand the Vocabulary of LLMs with 0.01GB of Target Language Text?Jan 6, 2026Enhancing Linguistic Competence of Language Models through Pre-training with Language Learning Tasks Sep 4, 2021Frustratingly Simple Pretraining Alternatives to Masked Language Modeling Dec 4, 2025Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Source-Shielded Updates Oct 2, 2023appjsonify: An Academic Paper PDF-to-JSON Conversion Toolkit Dec 16, 2024Adapting Chat Language Models Using Only Target Unlabeled Language Data Mar 3, 2023Hitachi at SemEval-2023 Task 3: Exploring Cross-lingual Multi-task Strategies for Genre and Framing Detection in Online News Dec 6, 2021Team Hitachi @ AutoMin 2021: Reference-free Automatic Minuting Pipeline with Argument Structure Construction over Topic-based Summarization Aug 11, 2023Learning Deductive Reasoning from Synthetic Corpus based on Formal Logic Apr 15, 2026How Can We Synthesize High-Quality Pretraining Data? A Systematic Study of Prompt Design, Generator Model, and Source Data Nov 19, 2024Enhancing Reasoning Capabilities of LLMs via Principled Synthetic Logic Corpus