生物學變天:小扎的新開源模型,徹底掀翻谷歌AlphaFold王座

重點摘要
【導讀】AlphaFold 稱霸蛋白質 AI 多年,剛剛被正面戰勝了!扎克伯格旗下 Biohub 發佈 ESMFold2,一口氣預測 11 億個蛋白質結構,比 AlphaFold 多 8 億條,完全開源!
### 祖克柏旗下 Biohub 推出 ESMFold2:開源模型正面挑戰 AlphaFold 霸主地位
蛋白質結構預測領域長期由 DeepMind 的 AlphaFold 系列獨占鰲頭,但這項技術的壟斷格局可能正在鬆動。由馬克·祖克柏(Mark Zuckerberg)資助的非營利研究機構「Chan Zuckerberg Biohub」,近日正式發表全新開源模型 ESMFold2,一口氣預測了多達 11 億個蛋白質結構,數量比 AlphaFold 現有的公開資料庫整整多出 8 億條,並且完全開源釋出。這項突破不僅刷新了規模紀錄,更以「開源」策略直接挑戰 Google 旗下 DeepMind 的封閉生態。
### 重點整理:ESMFold2 的關鍵三大亮點
首先,ESMFold2 在預測規模上取得壓倒性優勢。根據 Biohub 公開的資訊,該模型一口氣產出 11 億個蛋白質結構,涵蓋細菌、病毒、植物與人類等廣泛物種,遠超過 AlphaFold 資料庫的約 3 億條結構。其次,ESMFold2 完全開源,包括模型權重、訓練程式碼與推理管線,讓全球學術機構與生技公司都能免費使用、修改與部署,相較於 AlphaFold 雖然有開放資料庫但模型本身仍受 Google 授權限制,開源程度更高。第三,ESMFold2 採用「語言模型」架構,直接從蛋白質序列學習結構,無需像 AlphaFold 那樣仰賴多序列比對(MSA)與模板,運算效率與可擴展性大幅提升。
### 背景脈絡:AlphaFold 為何需要被挑戰?
自 2021 年 AlphaFold2 發表以來,它已經預測了超過 2 億個蛋白質結構,徹底改變結構生物學的研究方式。但 AlphaFold 仍有兩個主要限制:一是深度學習模型本身並非完全開源,研究人員無法自由修改或重新訓練;二是運算資源門檻極高,每次預測都需要進行多序列比對,對於大規模蛋白質家族(如微生物暗物質)的掃描並不經濟。此外,AlphaFold 對「無序蛋白質」或「多樣性構型」的預測準確度仍有侷限。ESMFold2 的出現,正是試圖以更輕量、更開放的方式補足這些缺口。
### 可能影響:開源生態將加速藥物研發與基礎科學
ESMFold2 的開源特性將對生物科技產業產生深遠影響。過去,中小型實驗室若要使用 AlphaFold 進行大規模篩選,必須仰賴 DeepMind 的伺服器或自建高成本運算叢集;現在,ESMFold2 允許研究者在本地或雲端自由部署,甚至針對特定物種進行微調。這將大幅降低蛋白質結構預測的進入門檻,尤其有利於新興病原體(如未知病毒)的快速結構解析、抗體設計與藥物標靶篩選。另一方面,開源社群可以接力改進模型,例如加入翻譯後修飾、突變效應預測等功能,形成比封閉模型更快的創新循環。
### Google 的 AlphaFold 地位是否真的被「掀翻」?
儘管 ESMFold2 在「數量」與「開源」兩方面勝出,但學術界對其預測品質仍有討論空間。AlphaFold 在 CASP 競賽中累積的頂尖準確度(尤其是高解析度局部結構)仍是金標準;ESMFold2 目前公開的評測結果顯示,在部分指標上與 AlphaFold 接近,但在多域蛋白與複雜配體結合位點方面仍有差距。因此,與其說「掀翻王座」,更準確的描述是:開源模型首次在規模與可及性上取得對等競爭力,迫使 Google 與 DeepMind 必須重新思考其開放策略。短期內,AlphaFold 仍是高精度研究的首選,但長遠來看,開源生態的集體進步可能逐步縮小差距。
### 讀者可關注的後續:三大關鍵動態值得追蹤
對於關注 AI 與生物學融合的讀者,接下來有三件事值得密切觀察。第一,**開源社群的採用率**:ESMFold2 的 GitHub 儲存庫是否會迅速湧入貢獻者?是否會出現第三方優化版?這將決定其能否形成正向循環。第二,**DeepMind 的回應**:Google 是否會推出更開放的 AlphaFold
Related
相關文章

AI成績單背後,藏著一位華人“出題人”
這篇消息聚焦「AI成績單背後,藏著一位華人“出題人”」。原始導語提到:AI,你需要向虎證明自己很聰明。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

35歲被AI“頂替”,他用26萬的判決書扯下企業的遮羞布
這篇消息聚焦「35歲被AI“頂替”,他用26萬的判決書扯下企業的遮羞布」。原始導語提到:不是AI太強,是藉口太好用。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

別被不靠譜服務商忽悠,GEO優化沒有捷徑
這篇消息聚焦「別被不靠譜服務商忽悠,GEO優化沒有捷徑」。原始導語提到:怎麼重建GEO行業信任,避免踩坑? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

我把昨晚的夢輸入AI,它居然直接把我拉進去玩兒了一把?!
這篇消息聚焦「我把昨晚的夢輸入AI,它居然直接把我拉進去玩兒了一把?!」。原始導語提到:創作者的終極玩具來了 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

美國AI狂飆,亞洲搶先吃飽
這篇消息聚焦「美國AI狂飆,亞洲搶先吃飽」。原始導語提到:亞洲,正在成為全球算力基礎設施製造中心。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

馬斯克花600億美元,買了箇中國模型底座的代碼編輯器
這篇消息聚焦「馬斯克花600億美元,買了箇中國模型底座的代碼編輯器」。原始導語提到:錢的大頭,又讓別人賺走了 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。