[论文阅读] 人工智能 + 软件工程 | LLM当“裁判”靠谱吗?——解析代码生成与总结任务中的LLM评判能力
LLM当“裁判”靠谱吗?——解析代码生成与总结任务中的LLM评判能力论文:OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationarXiv:2507.16587OntheEffectivenessofLLM-as-a-judgeforCodeGenerationandSummarizationGiuseppeCrupi