Grok3翻车了
- 数码试物所
- 2025-02-19 23:18:05
Grok3翻车了 马斯克这次吹的「地表最强AI」Grok3,实测翻车得有点狠啊!
发布会PPT上数学编程屠榜,结果用户一问“9.11和9.9谁大”,直接宕机;直播演示游戏攻略,答案错得离谱,被网友吐槽“代练都不敢这么编”
算力堆到20万张H100,训练成本是竞品的263倍,但实际体验和R1、GPT4.5拉不开差距,分数只高1%—这波「大力出奇迹」变「大力出尴尬」了?
说白了,Grok3暴露了AI行业的大问题:靠算力硬卷的边际效应到头了,模型越训越大,但常识和基础逻辑反而拉胯。马斯克画饼的火星任务和诺奖突破,怕是要先解决“9.9和9.11”的数学危机。

发布会PPT上数学编程屠榜,结果用户一问“9.11和9.9谁大”,直接宕机;直播演示游戏攻略,答案错得离谱,被网友吐槽“代练都不敢这么编”

算力堆到20万张H100,训练成本是竞品的263倍,但实际体验和R1、GPT4.5拉不开差距,分数只高1%—这波「大力出奇迹」变「大力出尴尬」了?

说白了,Grok3暴露了AI行业的大问题:靠算力硬卷的边际效应到头了,模型越训越大,但常识和基础逻辑反而拉胯。马斯克画饼的火星任务和诺奖突破,怕是要先解决“9.9和9.11”的数学危机。
