2024年12月21日,OpenAI在12天活动...

  • 优秀的婉清
  • 2024-12-27 02:28:06
2024年12月21日,OpenAI在12天活动收尾之际正式发布了备受期待的o3系列模型。在外界观点AI发展速度趋缓之际,OpenAI带来了改变游戏规则的重大突破,向AGI迈出关键一步。

ARC-AGI测试中,o3模型创下新纪录:低算力配置下便以75.7%的得分登顶公共排行榜,而高算力版本更是达到87.5%的惊人成绩,一骑绝尘。

ARC-AGI-1从2020年GPT-3的0%提升到2024年GPT-4o的5%,历时四年。

这不仅仅是渐进式的改进,而是真正的突破。

传统大语言模型(LLM)采用"记忆-获取-应用"的范式,本质上是通过被动接触人类内容来存储和运行数百万个微型程序7。这种方法虽然能在特定任务上达到很高水平,但始终无法突破适应新环境或即时掌握新技能。

o3模型在token空间内进行自然语言程序搜索和执行,使用类似AlphaZero的蒙特卡洛树搜索方法,通过评估器模型引导搜索过程。实时生成和执行解决方案程序,通过思维链(Chain of Thought)实现知识的动态重组,展现出类人的任务适应能力。

虽然目前每个任务的计算成本仍然较高(低算力模式下约17-20美元/任务,相比人工解决方案的5美元/任务),这种成本预计将随技术发展快速下降。

毫无疑问,o3的出现无疑是一个里程碑式的突破。对于整个AI行业来说,o3的价值可能在于,它证明了AI进步不仅仅依赖于简单地扩大模型规模和增加训练数据,更关键的是架构创新,这种方法为AI的发展开辟了新的方向。
2024年12月21日,OpenAI在12天活动...