OpenAI发布了o1的正式版,终于可以看图了!赶紧找几道题来测试一下~~
结果嘛,可以说一言难尽……

第一题,思考了1分41秒,规律是找对了,但最后一步看岔了行,错了个莫名其妙。
第二题,思考了53秒,然而可以说是完全没有理解题目是什么意思,根本是在乱解……
第三题,思考了14秒,结果嘛……明明题目都说了不是6,还非要说仍然是6,就很让人无语了。
当然,也有不少题目是做对了的,就不展示了。
总结一下,只能说o1模型对于现实世界的理解还是不够到位,但人类的粗心大意、不懂装懂和固执己见,倒是学了个活灵活现。

真是,学好不容易,学坏分分钟。
