#模型时代# ChatGPT-Plus可能还是...

高飞
2024-09-11 08:20:46

模型时代 ChatGPT-Plus可能还是综合最佳模型服务。
最近Reflection 70b模型大火，但基准测试结果，也被多家机构质疑可能有作假嫌疑，其中就有独立模型评估机构Artificial Analysis（artificialanalysis.ai）。这家机构昨天也适时放出了一个它的模型服务排行榜。
所谓模型服务排行榜，是指消费者对可以订阅和免费使用的网络服务进行评测，而非针对某一款机型的评测。结果如下（全数据见：网页链接）：
综合最佳：ChatGPT Plus
最好的免费免费 ChatGPT
最适合图像Poe Pro
最适合编码克Claude Pro
最适合长语境Claude Pro
最适合数据：ChatGPT Pro

我对ChatGPT Plus和Claude Pro拿了多数第一不太意外，但是谷歌deepmind的Gemini Pro一个都没有，实在是让人感慨。大概是特色不够鲜明，Claude的编码已经公认，再加上有真正的长上下文，ChatGPT的综合推理也有口碑。反之，Gemini Pro确实都不占优势，不知道什么时候可以兑现它的原生多模态天赋。