换平台对比推理能力:DeepSeekR1强于Gemini2.0Flash

为了验证之前的猜测,换了个平台,也是免费的、提供多个大模型使用或测试的平台,这样大模型就不记得我了。

对比的是DeepSeek R1 (不知道满血版什么意思?不过做对了!)和 Gemini 2.0 Flash (不是Gemini 2.0 Flash Thinking Experimental) ,仍然是之前一道小学数学应用题的解答和推理能力。

两地A、B之间相距4000m;甲从A地以匀速60m/min向B出发,同时乙从B地出发以匀速260m/min向A出发。乙到达A地之后立即以同一匀速折返向B地,追上甲之后,甲和乙以相同的匀速175m/min到达B地。如果甲和乙分别从A、B两地相向出发的时刻是上午7:20, 则甲和乙携手到达B地时,距离上午8:00还差几分钟

这次两个大模型都不认识我(换了平台和账号)。都是一次性回答。差距明显:

换平台对比推理能力:DeepSeekR1强于Gemini2.0Flash_第1张图片

你可能感兴趣的:(大语言模型对比)