作者 / Shekoofeh Azizi,Google DeepMind 研究科學家、研究主管;Bryan Perozzi,Google Research 圖挖掘資深研究科學家
我們很榮幸發布與耶魯大學合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),這是一個新的 270 億參數基礎模型,旨在理解單個細胞的 "語言"。C2S-Scale 建立在 Gemma 開放模型系列的基礎上,代表著單細胞分析領域的新前沿。
此項成果的發布標志著 AI 在科學領域取得了新的里程碑。C2S-Scale 針對癌細胞行為提出了一個新穎的假說,并且后續已經在活體細胞中的實驗證實了這一預測。這一發現為開發抗癌療法開辟了一條具有前景的新途徑。
此次發布的模型建立在我們今年早些時候的研究成果上,我們當時證明了生物模型遵循明確的規模定律 (Scaling Law)。就像在自然語言領域一樣,越大規模的模型在生物學任務中表現越出色。這項研究提出了一個關鍵問題: 更大規模的模型只是在現有任務中表現更好,還是可以使其具備全新的能力?規模化的真正意義,在于創造新想法,以及探索未知。
C2S-Scale 27B 的工作原理
癌癥免疫療法的一個主要難題在于許多腫瘤屬于 "冷腫瘤",難以被人體的免疫系統識別。使這些腫瘤細胞變 "熱" 的關鍵策略是通過被稱為抗原呈遞的過程,迫使腫瘤細胞發出能夠激活免疫反應的信號。
我們給新的 C2S-Scale 27B 模型布置了一個任務: 找到一種充當 "條件放大器" 的藥物,這種藥物只在特定的 "免疫激活環境" 中增強免疫信號,在這種環境中本身已經存在低水平但不足以自行誘導抗原呈遞的干擾素 (一種關鍵免疫信號蛋白)。要完成此任務,需要一定程度的條件推理能力,而這種推理能力似乎是模型規模擴大后呈現出的新能力;我們通過較小規模的模型無法解析出這種依賴特定環境的效應。
為了實現此目標,我們設計了一個雙重情境虛擬篩選來尋找這種特定的協同效應。虛擬篩選包括兩個階段:
免疫激活環境: 我們為模型提供了具有完整腫瘤-免疫相互作用和低水平干擾素信號傳導的真實患者樣本。
免疫惰性環境: 我們為模型提供了缺乏免疫環境的分離細胞系數據。
隨后,我們模擬了超過 4,000 種藥物在這兩種情境下的效果,并要求模型預測哪些藥物只會在免疫激活環境中促進抗原呈遞,從而使篩選結果與患者相關的環境更接近。在模型篩選出的眾多候選藥物中,一小部分 (10-30%) 符合條件的藥物已出現在先前的文獻中,而其余的候選藥物則在意料之外,此前并未發現它們與本次篩選目標有任何關聯。
從預測到實驗驗證
該模型的預測結果清晰明了。它識別出名為 silmitasertib (CX-4945) 的激酶 CK2 抑制劑擁有顯著的 "環境分離" 能力。該模型預測,在免疫激活環境中應用 silmitasertib 時,抗原呈遞急劇增加,但在免疫惰性環境中收效甚微。這個預測之所以如此振奮人心,是因為這是個十分新穎的觀點。雖然 CK2 與許多細胞功能有關,包括作為免疫系統的調節劑,但文獻中尚未提到過通過 silmitasertib 抑制 CK2 來顯著增強 MHC-I 表達或促進抗原呈遞。這表明,該模型產生了一個可檢驗的全新假說,而不僅僅是重復已知的事實。
然而,預測只有在臨床應用中得到驗證時才有價值。真正的檢驗首先需要在實驗室進行,最終才能走向臨床實踐。
在該項目的下一階段,我們將這一假說帶到實驗室,并在人類神經內分泌細胞模型中進行了測試。這種細胞類型從未出現在模型訓練過程中。實驗證明:
單獨使用 silmitasertib 處理細胞對抗原呈遞 (MHC-I) 沒有影響。
單獨使用低劑量干擾素處理細胞的效果有限。
而使用 silmitasertib 配合低劑量干擾素處理細胞使抗原呈遞產生了顯著的協同擴增。
值得注意的是,在我們的實驗室測試中,silmitasertib 和低劑量干擾素的組合讓抗原呈遞顯著增加了約 50%,這使免疫系統更容易識別腫瘤。
該模型的計算機模擬預測結果在體外實驗中多次得到證實。C2S-Scale 已成功識別出一種全新干擾素條件放大器,揭示了一個使 "冷" 腫瘤變 "熱" 的潛在新途徑,并可能使免疫治療產生更佳的反應。雖然這只是初步的嘗試,但它為開發新的聯合療法 (即多種藥物協同使用,以實現更強效果) 提供了經實驗驗證的強有力方向。
這一結果也為新的生物學發現方法提供了可參考的藍圖。它表明,通過遵循規模定律并構建像 C2S-Scale 27B 這樣更大的模型,我們可以創建出足夠強大的細胞行為預測模型,使其運行高通量虛擬篩選,發現基于特定情境下的生物學現象,并生成具備生物學基礎的假說。
目前,耶魯大學的團隊正在探索本文中發現的機制,并在其他免疫環境中驗證 AI 生成的其他預測。通過進一步的臨床前和臨床驗證,這些假說有望加速新療法的研發。
開始使用 C2S-Scale 27B
新的 C2S-Scale 27B 模型及相關資源現已可供研究人員使用。誠邀您探索這些工具,在我們研究的基礎上持續創新,共同探索生命的語言。
-
Google
+關注
關注
5文章
1807瀏覽量
60509 -
AI
+關注
關注
91文章
39754瀏覽量
301344 -
模型
+關注
關注
1文章
3751瀏覽量
52097
原文標題:C2S-Scale 27B 模型: AI 解碼 "細胞語言",發現癌癥療法新途徑
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
谷歌推出TranslateGemma全新開放翻譯模型系列
谷歌正式發布Gemma Scope 2模型
借助谷歌FunctionGemma模型構建下一代端側智能體
每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri
泰凌微:布局端側AI,產品支持谷歌LiteRT、TVM開源模型
FD30-36S18B3(C) FD30-36S18B3(C)
FD50-18S15B3C2 FD50-18S15B3C2
FD20-36S24B2C5 FD20-36S24B2C5
FD50-48S09B3(C) FD50-48S09B3(C)
FD50-18S15B3(C)2 FD50-18S15B3(C)2
FD12-36S24B2C5 FD12-36S24B2C5
PFD12-36S24B2(C)5 PFD12-36S24B2(C)5
FD6-36S24B2C5 FD6-36S24B2C5
谷歌與耶魯大學合作發布最新C2S-Scale 27B模型
評論