港大马毅谈“智能史”:DNA...
- 深圳Jacky
- 2025-05-28 19:25:29
港大马毅谈“智能史”:DNA 是最早的大模型,智能的本质是减熵。
(公众号“晚点LatePost”访谈文章,笔记)
一、智能的本质是 “学习” —— 生命就是智能的载体。
从 DNA 出现,到神经系统诞生、寒武纪物种大爆发,再到人类的语言与数学的诞生,智能有不同的表现形式。但不变的是,智能都是在学习外部世界的知识与规律,从而进行预测,使知识可以为我所用。
二、智能是在寻找规律并利用规律,是一个对抗宇宙熵增的过程。某种意义上说,生命就是智能,或者说是智能的载体。整个宇宙在熵增,世界越来越混乱,而生命则是熵减的。
(注:根据热力学第二定律,封闭系统的熵不断增长,即混乱度不断提升,在系统平衡时达到最大值;熵减则是混乱度减少的过程。)
三、生命和智能的本质就是 “学习” —— 是要在还没有变得完全不可预测的世界里,找到有规律、有结构、可预测的东西,进而能预测外部世界,生命才能生存。
四、低等生物也能学习和预测外部世界的规律。
大约在 40 亿年前,生命在地球上的最初状态,与现在的大模型也有关联。生命最初如何编码外部知识?是通过 DNA(脱氧核糖核酸)。可以说 DNA 就是世界上最早的大模型,它通过脱氧核糖核酸的碱基结构,有规则地记录外部世界的规律,这很像语言。
五、靠 DNA 学习的状态持续了 30 多亿年,这时单个生命体无法 “学习”。但通过一代代基因变异和自然选择,完成了物种层面的学习,即一个物种,整体上能跟环境形成闭环,能通过一代代遗传、变异,改进对外部世界的知识。所以单个生物个体没有智能,但进化本身实现了物种层面的智能机制。
六、这整个过程中,智能始终在做一件事:对外部世界的知识做编码。但要搞清楚,知识本身并不是智能,知识是智能活动的结果;通过观测和感知外部信号,从中抽取描述外部世界规律的能力,也就是“学习”,这才是智能。
七、当生命进化到人类诞生后,就有了一件了不起的事情 —— 语言和文字。这极大提升了群体获取和传递知识的效率,进而提高了生存概率。
比如,一个人找到了水,就能告诉其他人,大家不用再试一遍。当有了文字后,知识又开始更高效地传给下一代。语言和文字跟 DNA 一样,都能代际传承知识。只是 DNA 变异很慢,而语言和文字使文明发展速度极大地提高了。
八、这样来看,生物的智能经历了 4 个发展阶段,从 DNA 到记忆,再到文字和科学;它们机制各有不同,后期的智能并没有取代早期智能,它们是叠加、并存的关系:
第一阶段:物种通过基因变异实现进化,靠的是强化学习、自然选择。
第二阶段:单个生命体出现神经系统,形成记忆,个体增加了自适应和不断纠错的能力。
第三阶段:文明依靠语言和文字流传。但这部分知识只是每个人能学到的外部物理世界模型的一小部分。
第四阶段:数学和科学产生,能对外部规律作高度概括、抽象、凝练,科学能被证实或证伪,在不断改进。
九、现在很多人对大模型的误解,就是把知识当成了智能。如果一个系统只是拥有知识,而没有更新和修正自身已有知识的机制,它仍然没有智能。
十、所以再大的大模型现在也没有智能,GPT-1 没有,GPT-2 没有,GPT-3 同样没有。但结合 OpenAI 工程师的不断研发和改进,GPT 的整个迭代过程是有智能的。这就像 DNA 本身没有智能,但它不断随机变异,再被自然界选择这个过程,具备了智能。
(公众号“晚点LatePost”访谈文章,笔记)
一、智能的本质是 “学习” —— 生命就是智能的载体。
从 DNA 出现,到神经系统诞生、寒武纪物种大爆发,再到人类的语言与数学的诞生,智能有不同的表现形式。但不变的是,智能都是在学习外部世界的知识与规律,从而进行预测,使知识可以为我所用。
二、智能是在寻找规律并利用规律,是一个对抗宇宙熵增的过程。某种意义上说,生命就是智能,或者说是智能的载体。整个宇宙在熵增,世界越来越混乱,而生命则是熵减的。
(注:根据热力学第二定律,封闭系统的熵不断增长,即混乱度不断提升,在系统平衡时达到最大值;熵减则是混乱度减少的过程。)
三、生命和智能的本质就是 “学习” —— 是要在还没有变得完全不可预测的世界里,找到有规律、有结构、可预测的东西,进而能预测外部世界,生命才能生存。
四、低等生物也能学习和预测外部世界的规律。
大约在 40 亿年前,生命在地球上的最初状态,与现在的大模型也有关联。生命最初如何编码外部知识?是通过 DNA(脱氧核糖核酸)。可以说 DNA 就是世界上最早的大模型,它通过脱氧核糖核酸的碱基结构,有规则地记录外部世界的规律,这很像语言。
五、靠 DNA 学习的状态持续了 30 多亿年,这时单个生命体无法 “学习”。但通过一代代基因变异和自然选择,完成了物种层面的学习,即一个物种,整体上能跟环境形成闭环,能通过一代代遗传、变异,改进对外部世界的知识。所以单个生物个体没有智能,但进化本身实现了物种层面的智能机制。
六、这整个过程中,智能始终在做一件事:对外部世界的知识做编码。但要搞清楚,知识本身并不是智能,知识是智能活动的结果;通过观测和感知外部信号,从中抽取描述外部世界规律的能力,也就是“学习”,这才是智能。
七、当生命进化到人类诞生后,就有了一件了不起的事情 —— 语言和文字。这极大提升了群体获取和传递知识的效率,进而提高了生存概率。
比如,一个人找到了水,就能告诉其他人,大家不用再试一遍。当有了文字后,知识又开始更高效地传给下一代。语言和文字跟 DNA 一样,都能代际传承知识。只是 DNA 变异很慢,而语言和文字使文明发展速度极大地提高了。
八、这样来看,生物的智能经历了 4 个发展阶段,从 DNA 到记忆,再到文字和科学;它们机制各有不同,后期的智能并没有取代早期智能,它们是叠加、并存的关系:
第一阶段:物种通过基因变异实现进化,靠的是强化学习、自然选择。
第二阶段:单个生命体出现神经系统,形成记忆,个体增加了自适应和不断纠错的能力。
第三阶段:文明依靠语言和文字流传。但这部分知识只是每个人能学到的外部物理世界模型的一小部分。
第四阶段:数学和科学产生,能对外部规律作高度概括、抽象、凝练,科学能被证实或证伪,在不断改进。
九、现在很多人对大模型的误解,就是把知识当成了智能。如果一个系统只是拥有知识,而没有更新和修正自身已有知识的机制,它仍然没有智能。
十、所以再大的大模型现在也没有智能,GPT-1 没有,GPT-2 没有,GPT-3 同样没有。但结合 OpenAI 工程师的不断研发和改进,GPT 的整个迭代过程是有智能的。这就像 DNA 本身没有智能,但它不断随机变异,再被自然界选择这个过程,具备了智能。