Alphafold開發者獲2024諾貝爾化學獎,AI搶奪科學家的最重要榮譽

10.9

知識分子

The Intellectual

導 讀

剛剛,2024年諾貝爾化學獎公佈,一半授予大衛·貝克(David Baker),“以表彰在計算蛋白質設計方面的貢獻”;另一半則共同授予德米斯·哈薩比斯(Demis Hassabis)和約翰·M·詹珀(John M. Jumper),“以表彰他們在蛋白質結構預測方面的成就”。

德米斯·哈薩比斯和約翰·詹珀成功地利用人工智能技術預測了幾乎所有已知蛋白質的結構。而大衛·貝克掌握了生命的構建模塊,並創造了全新的蛋白質。

撰文 | 秦朗

2024年諾貝爾化學獎獲得者:戴密斯·哈薩比斯(Demis Hassabis)、約翰·喬普(Jonh Jumper)、大衛·貝克(David Baker)

戴密斯·哈薩比斯 (Demis Hassabis)

哈薩比斯早就享譽國際科技圈。出生於1976年,在倫敦長大,母親是新加坡華人。4歲開始下國際象棋,有“國際象棋神童”的美譽,8歲自學編程,13歲時達到了大師標準。本科以計算機科學雙一的成績畢業於劍橋大學,後來在倫敦大學學院完成了認知神經科學博士學位,又在MIT和哈佛攻讀博士後。

2010年,他與在倫敦大學學院讀博士遇到的施恩·萊格(Shane Legg)共同創辦了DeepMind並擔任CEO。2014年,DeepMind被Google收購,在Alphabet旗下獨立運營。2023年,DeepMind與“谷歌大腦”合併,Hassabis升任合併後的Google DeepMind團隊CEO。

約翰·喬普(John Jumper)

DeepMind Technologies高級研究科學家,AlphaFold的第一作者。他在芝加哥大學獲得博士學位,主要研究方向是使用ML來模擬蛋白質摺疊和動力學。2021年,他被Nature列爲年度榜單中的十大“重要人物”之一。

戴維·貝克(David Baker)

1962年出生於美國華盛頓州西雅圖,現爲華盛頓大學蛋白質設計研究所所長。他因開發從頭設計自然界從未出現的新型蛋白的技術,獲得2020年科學突破獎生命科學獎,並首次使用生成式人工智能從頭設計出了全新的抗體,有望讓AI從頭設計蛋白進入抗體藥物市場。

他還堪稱蛋白質設計領域“鼻祖級”人物,比DeepMind更早提出了預測和設計蛋白質三維結構的方法,甚至設計出了一款比AlphaFold更早的蛋白結構設計算法——RoseTTAFold。

爲什麼是蛋白摺疊?

作爲支撐人體基本生命活動的物質,蛋白質由20種氨基酸呈念珠狀連接形成三維形狀,而形狀本身決定了蛋白質的功能,所以研究蛋白質形狀一直是醫學領域的熱門方向。

在 AlphaFold 出現之前,這都需要通過實驗來完成的。讓蛋白質結晶是件非常困難的事情,有些蛋白質不能像膜蛋白那樣結晶,必須使用昂貴的電子顯微鏡或X射線晶體分析儀,耗費數月、甚至幾年,才能得到三維結構並將其結構可視化。無數博士都在研究單一蛋白質的摺疊。

而AlphaFold2 能夠直接從蛋白質的氨基酸序列中預測蛋白質的3D結構,並且達到原子級精度,被認爲解決了困擾人類50年曆史的蛋白質摺疊挑戰,迅速推進了人類對基本生物過程的理解,並促進藥物設計。

2018年,DeepMind官宣了旗下AlphaFold。初亮相時,它在第13屆“蛋白質結構預測奧運會”CASP比賽中,成功預測了43種蛋白質中25種蛋白質的最準確結構,力壓其他97個參賽者。

DeepMind發佈的一個蛋白質3D數字演示圖

A DeepMind model of a protein from the Legionnaire's disease bacteria (Casp-14)(軍團病細菌(Casp-14)蛋白質的DeepMind模型)

基於初代版本,2020年,DeepMind又祭出了AlphaFold2。它能夠在廣泛領域進行蛋白質結構的預測,已經將兩億多蛋白的三維結構全部都預測出來,在結構生物學中是最重要的里程碑的貢獻,對後續蛋白質結構及功能研究具有開創性意義。

該系統還在應用層面,特別是對生物製藥的促進作用巨大。瞭解蛋白質的三維結構,對於設計針對性的藥物分子也大有幫助。如今全球已有數百萬研究人員將AlphaFold 2 應用在瘧疾疫苗、癌症治療和酶設計等領域,有了不少新的發現。之後的AlphaFold-Multimer 則推動了對蛋白質-蛋白質複合物的預測。

今年5月,由 Google DeepMind 和 Isomorphic Labs 研究團隊推出的新一代 AlphaFold—— AlphaFold 3登上了 Nature。

據介紹,AlphaFold 3 以前所未有的精確度成功預測了所有生命分子(蛋白質、DNA、RNA、配體等)的結構和相互作用。與現有的預測方法相比,AlphaFold 3 發現蛋白質與其他分子類型的相互作用至少提高了 50%,對於一些重要的相互作用類別,預測準確率甚至提高了一倍。

研究團隊認爲,AlphaFold 3 可以將我們從蛋白質帶入廣泛的生物分子領域,這一飛躍有望開啓更具變革性的科學——從開發生物可再生材料和更具抗逆性的作物,到加速藥物設計和基因組學研究,進而開啓人工智能細胞生物學的新時代。

從圍棋到蛋白質結構預測

2016年,一場“對決”吸引了全世界的目光。韓國圍棋選手李世石與AlphaGo,進行了一場 “世紀人機大戰”。最終,AlphaGo以 3:00 的戰績獲得勝利。

作爲AlphaGo背後的英雄,Google旗下人工智能企業DeepMind的創始人Demis Hassabis,也獲得了全球的關注。

許多人認爲圍棋是世界上最複雜的棋盤遊戲。當 DeepMind 團隊在慶祝獲勝時, Hassabis已經在考慮一個更大的挑戰。他意識到該公司的技術已經準備好應對生物學中最重要和最複雜的難題之一:預測蛋白質的結構,這個 50 年來科研人員一直試圖解決的難題。

在 Hassabis的心中,構建的 AlphaGo雖然與遊戲相關,但最終目標不僅僅是破解遊戲,而是使用它來引導通用學習系統,並應對現實世界的挑戰,致力於像蛋白質摺疊這樣的科學挑戰。

2016 年,AlphaGo 獲得成功後的幾個月內,DeepMind 僱傭了一些生物學家,併成立了一個小型跨學科團隊來解決蛋白質摺疊問題。

2018年,DeepMind官宣了旗下AlphaFold。初亮相時,它在第13屆“蛋白質結構預測奧運會”CASP比賽中,成功預測了43種蛋白質中25種蛋白質的最準確結構,力壓其他97個參賽者。

CASP競賽成立於 1994 年,其旨在通過每兩年讓計算機化預測方法相互競爭來加快研究速度。然而,沒有任何一種技術能達到實驗室工作的準確性。到 2016 年,相關工作進展已經停滯了十年。

基於初代版本,2020年,DeepMind又開發了AlphaFold2。它已經能成功解決蛋白質摺疊問題,在預測蛋白質結構上,和實驗室生產模型的精度誤差範圍,首次縮小到只有一個原子的寬度。生物學家對它的出色表現感到震驚。AlphaFold 使用了蛋白質數據庫中現有的蛋白質結構作爲大數據基礎。這是一個國際數據庫,包含了生物學家幾十年來不斷增加的已解決的結構。

2021年7月,AlphaFold成功預測了近98.5%的人類蛋白質結構。而到了2022年7月AlphaFold預測了幾乎“整個蛋白質宇宙”。

按照哈薩比斯接受媒體採訪時的說法,多年來,他一直在斷斷續續地思考蛋白質問題。20 世紀 90 年代,當他還是劍橋大學的一名本科生時,他就接觸到了這個問題。他表示:“我的一個朋友對這個問題很着迷,他會抓住任何機會(在酒吧裡或者打檯球的時候)跟我說,如果我們能破解蛋白質摺疊,這將是生物學的變革。他的激情始終讓我不能釋懷。”

AlphaFold 的成功標誌着 DeepMind 的發展方向已然發生改變,工作重點從遊戲轉向科學,以期對現實世界產生更大影響。

2021年7月,DeepMind首次通過與歐洲分子生物學實驗室(EMBL)合作建立的數據庫公開發布AlphaFold預測結果,初始數據庫包含了所有人類蛋白質的98%

人工智能掀起生物醫學革命

AlphaFold 3 具備了藥物設計的能力,可以預測藥物中常用的分子(如配體和抗體),這些分子可與蛋白質結合,改變蛋白質在人類健康和疾病中的相互作用方式。在預測類似藥物相互作用(包括蛋白質與配體的結合以及抗體與靶蛋白的結合)方面,AlphaFold 3 達到了前所未有的準確性。

爲了利用 AlphaFold 3 在藥物設計方面的潛力,Isomorphic Labs 已經與製藥公司合作,將其應用於現實世界的挑戰,並最終爲一些對人類造成最具破壞性影響的疾病開發出新的療法。

據瞭解,Isomorphic Labs 將 AlphaFold 3 與一套補充的內部人工智能模型結合,正在爲內部項目以及製藥合作伙伴進行藥物設計。

值得關注的是,Demis Hassabis 同時領導着生物技術初創公司Isomorphic Labs。它成立於 2021 年,同樣由Google的母公司 Alphabet 投資,旨在將 DeepMind 在生物學方面的人工智能研究進一步帶入製藥行業,希望在藥物發現領域帶來一場 AI 革命,使用人工智能來加速藥物發現,並最終找到治療人類一些最具破壞性的疾病的方法。

很長一段時間以來,Demis Hassabis 一直在想,一旦人工智能足夠複雜、足夠強大,他最先想做的,是幫助治療疾病和理解生物學。

從人工智能優先的角度進行藥物發現,在計算機中完成大部分研究,並將實驗室留給驗證,是其中一個重要內容。

與分子發生反應,搭建通路,最終形成一個虛擬細胞,是他的一個夢想。這樣,就可以在虛擬細胞上進行大量實驗,最後階段再進入實驗室來驗證。就發現新藥而言,目前從確定目標到擁有一個候選藥物大約需要10年時間,如果能在虛擬細胞中完成大部分工作,或許可以將時間縮短一個數量級。

DeepMind正與更多實驗室合作,通過構建虛擬細胞進行大量實驗,以大大縮短醫學及藥物方面的研究時間。

DeepMind 已經發布了該系統的詳細工作原理,併發布了源代碼。AlphaFold 開源之後,影響力逐漸擴大。在該公司還與歐洲生物信息學研究所(European Bioinformatics Institute)建立了一個公共數據庫,該數據庫正在填充 AI 預測的新的蛋白質結構,條目幾乎是科學已知的所有蛋白質。

Google DeepMind 也基於AlphaFold 3 推出了免費平臺AlphaFold Server,供全世界的科學家利用它進行非商業性研究,預測蛋白質如何與細胞中的其他分子相互作用。

只需點擊幾下,生物學家就可以利用 AlphaFold 3 爲由蛋白質、DNA、RNA 以及選擇的配體、離子和化學修飾組成的結構進行建模。

對此,Francis Crick 研究所 Uhlmann 實驗室的研究科學家 Céline Bouchoux 評價道:

“AlphaFold 3 一經發布,有可能像 AlphaFold 一樣具有開創性。有了 AlphaFold Server,其不再僅僅是預測結構,而是慷慨地提供訪問權限:允許研究人員提出大膽的問題,並加速發現。”

這兩年,AlphaFold成爲了生物醫藥界的新貴,甚至獲得了不少生物醫藥相關的科學大獎。世界各地的一些團隊已經開始在抗生素耐藥性、癌症和新冠病毒等研究中使用 AlphaFold。

另一個重大進展是,今年3月18日,David Baker在預印本BioRxiv上發文,首次使用生成式人工智能從頭設計出了全新的抗體,這一重要發現未來有望讓AI從頭設計蛋白進入抗體藥物市場。

鮮爲人知的是,AlphaFold一直存在諸多競爭者,其中最爲知名的莫過於華盛頓大學的David Baker團隊。

Baker是預測和設計蛋白質三維結構方法的開創者,早在1998年由他主導設計的蛋白結構設計算法Rosetta就有了最初版本,遠遠早於AlphaFold。而這兩年,Baker更是致力於超越AlphaFold,爲此,Baker團隊曾在Science雜誌上連發3篇論文,介紹新算法ProteinMPNN。他認爲,ProteinMPNN之於蛋白質設計,就像AlphaFold之於蛋白質結構預測一樣。

“AI for Science”:AlphaFold可能是AI變革科學發現的開始

雖然通常被當作遊戲和圍棋界的明星事物想起,談及2010 年創辦DeepMind時,Hassabis認爲其只有一個目標——創造解決世界上一切問題的通用人工智能(AGI),並將之形容爲“21 世紀的阿波羅登月計劃”。

在讀博士期間,他夢想有一天創造出“人工智能科學家”,也就是說,創造一個比人類科學家還要聰明的“機器人科學家”。十多年來,DeepMind一直是推進人工智能技術前沿發展的先鋒,通常是使用遊戲作爲開發通用目的學習系統的試驗場。

Hassabis的想法是,通過AI,將科學加速到極致,並且認爲自己已經發現了一種“讓科學研究更有效率”的方法。在他眼中,人工智能系統正變得足夠強大,可以應用於許多現實世界的問題,包括科學發現本身。他認爲,有一天,人工智能系統可能會解決像廣義相對論這樣的問題。

“癌症、氣候變遷、能源、基因組學、宏觀經濟學、金融系統、物理學等,太多我們想掌握的系統知識正變得極其複雜,如此巨大的信息量讓最聰明的人窮其一生也無法完全掌握。如何才能從如此龐大的數據量中篩選出正確的見解呢?”他認爲,未來超級智能機器將與人類專家合作解決一切問題,一種通用人工智能可以自動將非結構化信息轉換爲可使用知識,這是一種針對任何問題的元解決方法(meta-solution)。

雖然他的夢想聽起來還有點遙遠,在現實中,藉助 AlphaFold,DeepMind 開啓了新篇章。公司正投資一個名爲“AI for Science”的團隊,它已經發表了一系列出版物,涉及從天氣預報到數學、量子化學和核聚變等領域。它們都沒有 AlphaFold 的影響力,但雄心顯而易見。

事實上,從根本上加快科學研究的步伐,尤其對醫學、氣候科學和綠色技術等領域的幫助,並非Hassabis或者DeepMind單個的夢想。

當前,在各個領域,應用人工智能方法分析數據、構建複雜生物現象的強大預測模型和生成模型,已然成爲強大的科技創新潮流。例如,用AI識別新的抗生素、揭示希格斯玻色子,建模和分析星系形成,篩選粒子對撞機或機器人望遠鏡產生的大量數據、尋找其中的規律,識別具有電池或太陽能電池所需特性的材料,等等。

AI變革科學發現的歷程,可能真的剛剛開始。

參考文獻:(上下滑動可瀏覽)

1.Alphahold official website:https://www.deepmind.com/research/highlighted-research/alphafold

2.2021 BREAKTHROUGH OF THE YEAR:https://www.science.org/content/article/breakthrough-2021

3.How Google Plans to Solve Artificial Intelligence:https://www.technologyreview.com/2016/03/31/161234/how-google-plans-to-solve-artificial-intelligence/

4.One of biology's biggest mysteries 'largely solved' by AI:https://www.bbc.com/news/science-environment-55133972

5.How artificial intelligence can revolutionise science:

https://www.economist.com/leaders/2023/09/14/how-artificial-intelligence-can-revolutionise-science

6.The superhero of artificial intelligence: can this genius keep it in check?

https://www.theguardian.com/technology/2016/feb/16/demis-hassabis-artificial-intelligence-deepmind-alphago

7.拉斯克獎揭曉!專家詳解:https://baijiahao.baidu.com/sid=1777762137149969481&wfr=spider&for=pc

8.Accurate structure prediction of biomolecular interactions with AlphaFold 3https://www.nature.com/articles/s41586-024-07487-w

9.首次用生成式AI設計抗體,蛋白質設計領域“鼻祖”David Baker的最新研究

https://mp.weixin.qq.com/s/DMRGSUjeHuPnKtzOBJfm2Q