#模型时代# ChatGPT-Plus可能还是...
- 高飞
- 2024-09-11 08:20:46
模型时代 ChatGPT-Plus可能还是综合最佳模型服务。
最近Reflection 70b模型大火,但基准测试结果,也被多家机构质疑可能有作假嫌疑,其中就有独立模型评估机构Artificial Analysis(artificialanalysis.ai)。这家机构昨天也适时放出了一个它的模型服务排行榜。
所谓模型服务排行榜,是指消费者对可以订阅和免费使用的网络服务进行评测,而非针对某一款机型的评测。结果如下(全数据见:
网页链接):
综合最佳:ChatGPT Plus
最好的免费免费 ChatGPT
最适合图像Poe Pro
最适合编码克Claude Pro
最适合长语境Claude Pro
最适合数据:ChatGPT Pro
我对ChatGPT Plus和Claude Pro拿了多数第一不太意外,但是谷歌deepmind的Gemini Pro一个都没有,实在是让人感慨。大概是特色不够鲜明,Claude的编码已经公认,再加上有真正的长上下文,ChatGPT的综合推理也有口碑。反之,Gemini Pro确实都不占优势,不知道什么时候可以兑现它的原生多模态天赋。
最近Reflection 70b模型大火,但基准测试结果,也被多家机构质疑可能有作假嫌疑,其中就有独立模型评估机构Artificial Analysis(artificialanalysis.ai)。这家机构昨天也适时放出了一个它的模型服务排行榜。
所谓模型服务排行榜,是指消费者对可以订阅和免费使用的网络服务进行评测,而非针对某一款机型的评测。结果如下(全数据见:

综合最佳:ChatGPT Plus
最好的免费免费 ChatGPT
最适合图像Poe Pro
最适合编码克Claude Pro
最适合长语境Claude Pro
最适合数据:ChatGPT Pro
我对ChatGPT Plus和Claude Pro拿了多数第一不太意外,但是谷歌deepmind的Gemini Pro一个都没有,实在是让人感慨。大概是特色不够鲜明,Claude的编码已经公认,再加上有真正的长上下文,ChatGPT的综合推理也有口碑。反之,Gemini Pro确实都不占优势,不知道什么时候可以兑现它的原生多模态天赋。