人造蛋白质蛋白质的一切功能...
- 苦丁山
- 2025-02-03 21:14:54
人造蛋白质
蛋白质的一切功能,无论是做建材,还是做催化酶,还是做免疫武器,,都取决于它的三维外形。最熟悉的例子应该是抗体。抗体能对抗病毒,就是因为抗体外形跟某个关键的病毒抗原外形嵌合,可以套在病毒抗原上。关键抗原被封禁,病毒就无法作祟。
所以,知道蛋白质的外形,对医学研究很重要,比如,我们可以用这种知识来研发新药。
要知道蛋白质的外形,以往的技术主要是靠拍摄,但蛋白质这么小的分子,不可能直接拍到它们的容貌,研究人员是用X线冲击蛋白质晶体,晶体让路过的X线有一定程度的偏斜,落到屏幕(或是感光片)上,就会是一组有点像波纹的图案。从这些图案出发,根据X线偏斜的规律,可以反推出蛋白质的三维结构。
这是个非常繁复的过程,从提纯蛋白到获取结晶,再到数据分析和计算,往往需要几个月甚至几年才能破解一种蛋白质的结构。
2024年,谷歌的 DeepMind 团队研发出 AlphaFold,这种人工智能工具能在几天甚至仅仅几个小时里破解一种蛋白质的结构,凭这样的速度,这个AI已经几乎破解了所有已经知道的蛋白质的结构。
AlphaFold 致力于破解现有蛋白质的结构。随着AI处理能力的迅速发展,纽约的海耶斯(Thomas Hayes)研发出一种新的智能工具,叫作 EvolutionaryScale Model 3,大致意思是“进化拓展模型,第三代”,简称ESM3。这个模型不仅仅能破解现有蛋白质的结构,还能对未知情况做推理。
它为什么能有这个能力,我们可以从当前流行的聊天AI里找线索。以 chatGPT 为代表的生成式 AI,之所以叫作生成式,是因为它的最底层的“思维”,是从目前已经知道的字和词出发(因为这些聊天AI训练的时候只阅读字词,没别的输入方式),推测下一个字词应该是什么。这听起来很简陋,但千百万个这样的“思维”单元协同工作,就产生了我们看到的智能表现。这并不奇怪,人脑创造了地球文明,但人脑的最底层运作,就是神经元之间的信号传递,这跟 chatGPT 的“感知器”(电子神经元)之间的信号传递没有本质区别。
聊天AI管聊天,所以它是从字词出发,预测下一个字词。ESM3 不管聊天,管的是蛋白质,所以它是从氨基酸出发,预测下一个氨基酸。因为这个本事,即使你手里只有一个蛋白质分子的残片,它也能推理出完整的分子结构。
而有这个本事,当然就不难想到,它甚至可以“设计”出自然界不存在的蛋白质分子,只要它的结构符合蛋白质分子的物理和化学规则,这个分子就能“存活”。
一些海葵体有一种叫 tagRFP 的蛋白质,能发出红色荧光。海耶斯以这种蛋白质做出发点,让ESM3设计一款同样有荧光功能,但能发出绿光的荧光蛋白质。EMS3设计出来的产品叫 esmGFP(ems就是“设计师”的名字,GFP的意思是 green fluorescent protein,绿色荧光蛋白)。这种蛋白自然界不存在,跟它的始祖蛋白 tagRFP 有 42%的氨基酸不同,但它确实可以“存活”:制作出来之后,它能正确折叠,而因为折叠正确,它表现出了预期的功能:放射荧光(如图,ESM拥有版权)。
自然进化会有各种可能产物,如果让海葵自然进化,也可能进化出这样的绿色荧光蛋白质,但若是等待自然进化,估计需要五亿年才能等到这一天。
人工智能让我们无需等待这么漫长的岁月,而是可以根据现有医学知识,主动设计出需要的蛋白质。这样的知识和技术,可以用来研发药物(比如抗癌抗体),或是生物材料,比如可以再生的心肌。
参考资料:
网页链接
网页链接
蛋白质的一切功能,无论是做建材,还是做催化酶,还是做免疫武器,,都取决于它的三维外形。最熟悉的例子应该是抗体。抗体能对抗病毒,就是因为抗体外形跟某个关键的病毒抗原外形嵌合,可以套在病毒抗原上。关键抗原被封禁,病毒就无法作祟。
所以,知道蛋白质的外形,对医学研究很重要,比如,我们可以用这种知识来研发新药。
要知道蛋白质的外形,以往的技术主要是靠拍摄,但蛋白质这么小的分子,不可能直接拍到它们的容貌,研究人员是用X线冲击蛋白质晶体,晶体让路过的X线有一定程度的偏斜,落到屏幕(或是感光片)上,就会是一组有点像波纹的图案。从这些图案出发,根据X线偏斜的规律,可以反推出蛋白质的三维结构。
这是个非常繁复的过程,从提纯蛋白到获取结晶,再到数据分析和计算,往往需要几个月甚至几年才能破解一种蛋白质的结构。
2024年,谷歌的 DeepMind 团队研发出 AlphaFold,这种人工智能工具能在几天甚至仅仅几个小时里破解一种蛋白质的结构,凭这样的速度,这个AI已经几乎破解了所有已经知道的蛋白质的结构。
AlphaFold 致力于破解现有蛋白质的结构。随着AI处理能力的迅速发展,纽约的海耶斯(Thomas Hayes)研发出一种新的智能工具,叫作 EvolutionaryScale Model 3,大致意思是“进化拓展模型,第三代”,简称ESM3。这个模型不仅仅能破解现有蛋白质的结构,还能对未知情况做推理。
它为什么能有这个能力,我们可以从当前流行的聊天AI里找线索。以 chatGPT 为代表的生成式 AI,之所以叫作生成式,是因为它的最底层的“思维”,是从目前已经知道的字和词出发(因为这些聊天AI训练的时候只阅读字词,没别的输入方式),推测下一个字词应该是什么。这听起来很简陋,但千百万个这样的“思维”单元协同工作,就产生了我们看到的智能表现。这并不奇怪,人脑创造了地球文明,但人脑的最底层运作,就是神经元之间的信号传递,这跟 chatGPT 的“感知器”(电子神经元)之间的信号传递没有本质区别。
聊天AI管聊天,所以它是从字词出发,预测下一个字词。ESM3 不管聊天,管的是蛋白质,所以它是从氨基酸出发,预测下一个氨基酸。因为这个本事,即使你手里只有一个蛋白质分子的残片,它也能推理出完整的分子结构。
而有这个本事,当然就不难想到,它甚至可以“设计”出自然界不存在的蛋白质分子,只要它的结构符合蛋白质分子的物理和化学规则,这个分子就能“存活”。
一些海葵体有一种叫 tagRFP 的蛋白质,能发出红色荧光。海耶斯以这种蛋白质做出发点,让ESM3设计一款同样有荧光功能,但能发出绿光的荧光蛋白质。EMS3设计出来的产品叫 esmGFP(ems就是“设计师”的名字,GFP的意思是 green fluorescent protein,绿色荧光蛋白)。这种蛋白自然界不存在,跟它的始祖蛋白 tagRFP 有 42%的氨基酸不同,但它确实可以“存活”:制作出来之后,它能正确折叠,而因为折叠正确,它表现出了预期的功能:放射荧光(如图,ESM拥有版权)。
自然进化会有各种可能产物,如果让海葵自然进化,也可能进化出这样的绿色荧光蛋白质,但若是等待自然进化,估计需要五亿年才能等到这一天。
人工智能让我们无需等待这么漫长的岁月,而是可以根据现有医学知识,主动设计出需要的蛋白质。这样的知识和技术,可以用来研发药物(比如抗癌抗体),或是生物材料,比如可以再生的心肌。
参考资料:

