"au:"Pingchuan Ma"" — arXiv2 Search

/ Date/ Name

/ Date/ Name

"au:"Pingchuan Ma"" — arXiv2 Search

Showing 1–11 of 11 results

/ Date/ Name

Mar 31, 2026SkillReducer: Optimizing LLM Agent Skills for Token Efficiency Mar 22, 2026WARBENCH: A Comprehensive Benchmark for Evaluating LLMs in Military Decision-Making Mar 23, 2025STShield: Single-Token Sentinel for Real-Time Jailbreak Detection in Large Language Models Jun 8, 2024SelfDefend: LLMs Can Defend Themselves against Jailbreaking in a Practical Manner Jan 27, 2024An Empirical Study on Large Language Models in Accuracy and Robustness under Chinese Industrial Scenarios Dec 7, 2023VRPTEST: Evaluating Visual Referring Prompting in Large Multimodal Models Oct 10, 2023Benchmarking and Explaining Large Language Model-based Code Generation: A Causality-Centric Approach Sep 29, 2023Split and Merge: Aligning Position Biases in LLM-based Evaluators May 4, 2023"Oops, Did I Just Say That?" Testing and Repairing Unethical Suggestions of Large Language Models with Suggest-Critique-Reflect Process Mar 6, 2023On Extracting Specialized Code Abilities from Large Language Models: A Feasibility Study Apr 20, 2022Unleashing the Power of Compiler Intermediate Representation to Enhance Neural Program Embeddings