论文阅读:2024 ACM SIGSAC Optimization-based Prompt Injection Attack to LLM-as-a-Judge

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

Optimization-based Prompt Injection Attack to LLM-as-a-Judge

https://arxiv.org/pdf/2403.17710

https://www.doubao.com/chat/4012027006548226

速览

这篇论文名为《Optimization-based Prompt Injection Attack to LLM-as-a-Judge》,主要探讨了针对大语言模型作为评判者(LLM-as-a-Judge)的优化提示注入攻击,核心观点是LLM-as-a-Judge存在安全隐患,现有防御手段不足,需要新的防御策略。

  1. 研究背景:大语言模型(LLMs)被广泛应用,LLM-as-a-Judge能从候选响应中选出最佳答案,

你可能感兴趣的:(论文阅读,论文阅读,prompt)