2024年12月21日，OpenAI在12天活动...

优秀的婉清
2024-12-27 02:28:06

2024年12月21日，OpenAI在12天活动收尾之际正式发布了备受期待的o3系列模型。在外界观点AI发展速度趋缓之际，OpenAI带来了改变游戏规则的重大突破，向AGI迈出关键一步。

ARC-AGI测试中，o3模型创下新纪录：低算力配置下便以75.7%的得分登顶公共排行榜，而高算力版本更是达到87.5%的惊人成绩，一骑绝尘。

ARC-AGI-1从2020年GPT-3的0%提升到2024年GPT-4o的5%，历时四年。

这不仅仅是渐进式的改进，而是真正的突破。

传统大语言模型（LLM）采用"记忆-获取-应用"的范式，本质上是通过被动接触人类内容来存储和运行数百万个微型程序7。这种方法虽然能在特定任务上达到很高水平，但始终无法突破适应新环境或即时掌握新技能。

o3模型在token空间内进行自然语言程序搜索和执行，使用类似AlphaZero的蒙特卡洛树搜索方法，通过评估器模型引导搜索过程。实时生成和执行解决方案程序，通过思维链（Chain of Thought）实现知识的动态重组，展现出类人的任务适应能力。

虽然目前每个任务的计算成本仍然较高（低算力模式下约17-20美元/任务，相比人工解决方案的5美元/任务），这种成本预计将随技术发展快速下降。

毫无疑问，o3的出现无疑是一个里程碑式的突破。对于整个AI行业来说，o3的价值可能在于，它证明了AI进步不仅仅依赖于简单地扩大模型规模和增加训练数据，更关键的是架构创新，这种方法为AI的发展开辟了新的方向。