"au:"Jiayang Song"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Jiayang Song"" — arXiv2 Search

Showing 1–20 of 21 results

/ Date/ Name

Jul 10, 2024Multilingual Blending: LLM Safety Alignment Evaluation with Language Mixture Nov 8, 2021When Cyber-Physical Systems Meet AI: A Benchmark, an Evaluation, and a Way Forward Oct 22, 2023LUNA: A Model-Based Universal Analysis Framework for Large Language Models Apr 7, 2018A Performance Analysis Model of TCP over Multiple Heterogeneous Paths for 5G Mobile Services Aug 7, 2024AcTracer: Active Testing of Large Language Model via Multi-Stage Sampling Apr 12, 2023AutoRepair: Automated Repair for AI-Enabled Cyber-Physical Systems under Safety-Critical Conditions Aug 20, 2024LeCov: Multi-level Testing Criteria for Large Language Models Nov 29, 2024Understanding the Design Decisions of Retrieval-Augmented Generation Systems Sep 13, 2023Self-Refined Large Language Model as Automated Reward Function Designer for Deep Reinforcement Learning in Robotics Aug 26, 2023ISR-LLM: Iterative Self-Refined Large Language Model for Long-Horizon Sequential Task Planning May 6, 2023Mosaic: Model-based Safety Analysis Framework for AI-enabled Cyber-Physical Systems Jul 31, 2023Towards Building AI-CPS with NVIDIA Isaac Sim: An Industrial Benchmark and Case Study for Robotics Manipulation Oct 15, 2025TRUSTVIS: A Multi-Dimensional Trustworthiness Evaluation Framework for Large Language Models Aug 7, 2024MORTAR: A Model-based Runtime Action Repair Framework for AI-enabled Cyber-Physical Systems Apr 12, 2024Online Safety Analysis for LLMs: a Benchmark, an Assessment, and a Path Forward Jun 6, 2024GenSafe: A Generalizable Safety Enhancer for Safe Reinforcement Learning Algorithms Based on Reduced Order Markov Decision Process Model Sep 19, 2024VLATest: Testing and Evaluating Vision-Language-Action Models for Robotic Manipulation Oct 7, 2024LADEV: A Language-Driven Testing and Evaluation Platform for Vision-Language-Action Models in Robotic Manipulation Jul 16, 2023Look Before You Leap: An Exploratory Study of Uncertainty Measurement for Large Language Models Jul 13, 2025Evaluating LLMs on Sequential API Call Through Automated Test Generation