ICML 2026｜上智院、上交大、復旦聯合提出FLAG擴散框架，還原空間轉錄組的基因-空間雙重結構

2026年6月29日 06:40

重點摘要

站內 AI 整理稿

原文作者：公眾號“ScienceAi”原文鏈接：https://mp.weixin.qq.com/s/lhrWc1-ABA4dZObLAuHMHQ 雷峰網轉載空間轉錄組學（Spatial Transcriptomics, ST）能在保留細胞空間位置的同時測量基因表達，對解析組織微環境與疾病微生態至關重要，但測序成本高、通量低。相比之下，H&E 染色的全切片圖像（WSI）在臨床中比較容易獲取。因此，「以圖測譜」，即直接從常規病理圖像預測空間基因表達正成為連接低成本影像與高維分子信息的關鍵橋樑。然而，現有方法大多將其簡化為對每個基因獨立的逐點回歸，僅以 PCC、MSE 等逐點指標評估，忽略了兩類關鍵的生物學結構：反映調控程序的「基因 - 基因」關係，以及反映組織構築的「基因 - 空間」分佈關係。而現有模型即便在單基因數值上尚可，所生成的表達圖譜卻常常「形似而神不似」。為此，上海科學智能研究院（下稱上智院）聯合上海交通大學、復旦大學等提出了結構感知的潛擴散框架 FLAG（Foundation model representation with Latent diffusion Alignment via Graph）。該框架將任務從「確定性迴歸」重新定義為「結構化分佈建模」，並首次系統揭示與刻畫了高維場景下的「基因維度詛咒」（Gene Dimension Curse）。實驗表明，FLAG 在保持 PCC/MSE 高度競爭力的同時，於結構保真度指標上實現顯著領先。該研究成果已被 ICML 2026 接收。上智院生命科學方向研究員斯奇、上海交通大學生物醫學工程學院博士生王鵬磊，是共同第一作者。上智院生命科學方向 AI 科學家郭昕，上智院 AI 科學家及生命科學方向負責人、復旦大學人工智能創新與產業研究院研究員程遠，是共同通訊作者。上智院生命科學方向研究員吳俁帥、焦一峰、劉旭陽，上智院首席科學家、復旦大學特聘教授漆遠，是共同作者。研究由星河啟智科學智能開放平臺提供技術支持。論文地址：https://arxiv.org/abs/2605.18055代碼地址：https://github.com/darkflash03/FLAG現有方法的兩大瓶頸一是「只見數值，不見結構」。判別式方法將每個基因視為獨立迴歸目標，天然會「抹平」從形態到表達本就存在的隨機性，導致過度平滑，既丟失基因間的協同調控網絡，也破壞基因在空間上的真實分佈紋理。二是圖擴散遭遇「基因維度詛咒」。把測量點與點間關係聯合去噪的「圖擴散」在小基因集上有效，但隨基因維度升高優化穩定性急劇惡化、最終崩潰。團隊從理論上給出解釋：高維下經驗相關性急劇集中，迫使模型逼近曲率極高的得分場，超出網絡逼近能力，並將其刻畫為優化下界 L (joint) − L (node) ≥ Ω(G)。FLAG 的三重創新設計FLAG 利用了空間圖編碼器作為基因潛空間擴散模型的先驗，且在訓練過程中與基因基礎模型對齊，分別承擔「空間畫布」「生成引擎」與「生物規則」的角色。圖 1 | FLAG 框架：H&E 經病理基礎模型編碼並構建點級圖，由空間圖編碼器聚合為空間上下文；條件擴散 Transformer 在此上下文下對基因表達去噪，並通過中間層對齊約束其與預訓練基因基礎模型的表徵一致。重定義任務：由於組織形態到基因表達的映射本質是一對多，FLAG 採用擴散生成範式，顯式逼近高維概率流形而非僅擬合條件期望，從而保留逐點目標忽略的內在相關性。破解維度詛咒：FLAG 不再在圖上聯合去噪節點與邊，而是把可靠拓撲作為固定先驗，由空間圖編碼器一次性聚合為對基因維度穩定的空間上下文，再以其引導基因維度的擴散，從而將高方差的「聯合生成」轉化為穩定的「條件生成」。注入生物先驗：在擴散主幹中間層引入對齊損失，將隱表示對齊至凍結的預訓練基因基礎模型（Geneformer、scGPT、CellPLM）。該先驗僅在訓練時使用，推理時無需調用，幾乎不增加部署成本。全面領先的實驗結果團隊提出兩項結構化指標：基因結構相關性（GSC）衡量基因調控網絡拓撲的保留，空間結構相關性（SSC）經 Moran's I 衡量空間自相關模式的保留。在 HEST-1k 基準的 HER2ST、KIDNEY、PRAD 三個數據集上，FLAG 在 PCC/MSE 保持高度競爭力的同時，結構指標全面領先：以 HER2ST 為例，其 SSC 達到同類生成式方法 STFlow 的兩倍以上，GSC 居所有方法之首。圖 2 | 「基因維度詛咒」實驗：隨基因數從 10 增至 800，聯合節點 - 邊擴散迅速崩潰、節點 - only 擴散顯著下滑，而 FLAG 在高維下仍保持高保真度。在直面「基因維度詛咒」的專項實驗中，FLAG 即便在 G=800 的高維設置下仍顯著優於兩類基線，證明其可擴展至更大規模、更具生物學代表性的基因面板。得益於離線預計算與凍結編碼器策略，FLAG 單卡（NVIDIA H800）訓練約 35 秒 / 輪、峰值顯存約 4.5GB，開銷與現有生成式模型相當。下游應用驗證結構保真度的最終價值在於能否轉化為可靠的生物學發現。FLAG 成功恢復了雌激素早期反應通路清晰的塊對角調控簇，並在差異表達基因（DEG）發現、空間域識別上全面領先，在 HER2ST 上取得 ARI 0.8451、NMI 0.9140，大幅優於所有對比方法；在提供專家分層標註的 DLPFC 數據集上，其聚類結果也最接近以真值表達建立的上界。圖 3 | 預測與真值對比：FLAG（左二）的預測較好還原組織真實的空間異質性。消融實驗進一步證實三大模塊協同必要：以確定性迴歸替換擴散主幹會使結構保真度嚴重塌縮，移除 GFM 對齊會同時損害精度與空間一致性，移除空間圖編碼器則破壞空間結構保真度 —— 三者分別充當「結構畫布」「生物規則」與「生成引擎」，缺一不可。總結與展望FLAG 巧妙融合了預訓練基礎模型的表徵能力與擴散生成的分佈建模能力：以靜態空間圖編碼器穩健刻畫組織拓撲，從根本上規避「基因維度詛咒」導致的訓練崩潰；以基因基礎模型對齊注入深層調控先驗，使生成的表達圖譜既精確又具備生物學結構一致性。其模塊化、與具體基礎模型解耦的設計，也為未來集成更強的病理與基因基礎模型預留了空間。該研究為「病理圖像→空間轉錄組」確立了兼顧精度與結構保真度的新範式，再次印證 AI 驅動生命科學的方向：跨越從擬合數值到還原生物學結構的鴻溝。未來，團隊計劃探索擴散推理加速、將圖主幹擴展至三維組織依賴，並攻克跨組織零樣本泛化，為可擴展、生物學一致的空間轉錄組生成與計算病理持續注入新動力。

原始來源：雷峰網 ↗

查看原始來源

36氪產業與商業

純靠AI“太不靠譜”了，福特緊急招350名老工程師

這篇消息聚焦「純靠AI“太不靠譜”了，福特緊急招350名老工程師」。原始導語提到：長期實踐形成的經驗、判斷和直覺，恰恰也是目前大模型最難複製的部分。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

TechWeb產業與商業

康迪科技2000萬元戰略投資控股信儲新能源，進軍AIDC備電儲能

本次交易總對價為人民幣2000萬元，將於2026年7月底前完成交割。此次投資標誌著康迪戰略性進軍全球AI數據中心備用電源及儲能市場，該市場正隨著AI基礎設施的加速部署而需求急劇增長。其產品專門用於滿足AI數據中心和高密度GPU計算環境對電能質量及可靠性的嚴苛要求。

剛剛閱讀分析

智東西產業與商業

AI算力搶電潮來襲？這家能源巨頭訂單排到2031年，微軟、谷歌、OpenAI搶著定

這篇消息聚焦「AI算力搶電潮來襲？這家能源巨頭訂單排到2031年，微軟、谷歌、OpenAI搶著定」。原始導語提到：GE Vernova當前燃氣輪機訂單已排至2029年，並延伸至2030—2031年，其中約20%來自AI數據中心需求。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析