科學(xué)家使用 NVIDIA BioNeMo 創(chuàng)建出能夠生成高質(zhì)量蛋白質(zhì)的大型語言模型,以此加快藥物研發(fā)并助力創(chuàng)造更具可持續(xù)性的環(huán)境。
初創(chuàng)企業(yè) Evozyne 使用 NVIDIA 提供的預(yù)訓(xùn)練 AI 模型,創(chuàng)造了兩種在醫(yī)療和清潔能源領(lǐng)域具有重大潛力的蛋白質(zhì)。
今日發(fā)布的一篇聯(lián)合論文描述了這一過程及產(chǎn)出的蛋白質(zhì)氨基酸序列。其中一種蛋白質(zhì)用于治療一種先天性疾病,另一種用于消耗二氧化碳以減少全球變暖。
初步研究結(jié)果展示了一種加速藥物研發(fā)的新方法。
Evozyne 聯(lián)合創(chuàng)始人、論文共同作者 Andrew Ferguson 表示:“令人欣喜的是,這個(gè) AI 模型第一輪產(chǎn)出的合成蛋白質(zhì)就像自然生成的蛋白質(zhì)一樣,表示該模型已經(jīng)學(xué)會(huì)了自然界的設(shè)計(jì)規(guī)則。”
革命性的 AI 模型
Evozyne 使用了 NVIDIA 的 ProtT5。ProtT5 是一個(gè) Transformer 模型,是用于創(chuàng)建醫(yī)療AI模型的軟件框架和服務(wù)——NVIDIA BioNeMo 的一部分。
分子工程師 Ferguson 的研究領(lǐng)域涵蓋化學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域,他表示:“BioNeMo 非常強(qiáng)大,讓我們能夠訓(xùn)練模型,然后以非常低的成本使用該模型來運(yùn)行工作任務(wù),在幾秒鐘內(nèi)就能生成數(shù)百萬個(gè)序列。”
該模型是 Evovyne ProT-VAE 流程的核心。ProT-VAE 是一個(gè)工作流,其將 BioNeMo 與作為過濾器的變分自編碼器(VAE)相結(jié)合。
他表示:“幾年前,還沒有人注意到可以使用大型語言模型與變分自編碼器相結(jié)合的方式來設(shè)計(jì)蛋白質(zhì)。”
讓模型向大自然學(xué)習(xí)
就如同人讀萬卷書,NVIDIA 的 Transformer 模型會(huì)讀取數(shù)百萬種蛋白質(zhì)中的氨基酸序列。該模型運(yùn)用神經(jīng)網(wǎng)絡(luò)用來理解文本的技術(shù),學(xué)會(huì)了大自然如何構(gòu)建蛋白質(zhì)氨基酸序列。
然后,該模型預(yù)測了如何組裝出能夠滿足 Evozyne 需求的新蛋白質(zhì)。
他表示:“這項(xiàng)技術(shù)正在助力我們開展工作,以實(shí)現(xiàn)十年前無法實(shí)現(xiàn)的夢想。”
無限的可能性
機(jī)器學(xué)習(xí)有助于研究海量可能的氨基酸組合,然后有效地識別最有用的序列。
傳統(tǒng)的蛋白質(zhì)工程設(shè)計(jì)方法,即定向進(jìn)化,采用的是一種緩慢、無計(jì)劃的方法,通常一次只改變幾個(gè)氨基酸的序列。

vozyne 的 ProT-VAE 流程采用了 NVIDIA BioNeMo 中強(qiáng)大的 Transformer 模型,生成有用的蛋白質(zhì),進(jìn)而助力藥物研發(fā)和能源領(lǐng)域?qū)崿F(xiàn)可持續(xù)性。
相比之下,Evozyne 的方法只通過一輪,就能改變一個(gè)蛋白質(zhì)中半數(shù)乃至以上的氨基酸。這相當(dāng)于進(jìn)行了數(shù)百次的突變。
他表示:“我們正在實(shí)現(xiàn)技術(shù)上的飛躍,這使我們能夠探索以前從未見過的、具有有用的新功能的蛋白質(zhì)。”
Evozyne 計(jì)劃使用新的工藝來構(gòu)建各種能夠?qū)辜膊『蜌夂蜃兓牡鞍踪|(zhì)。
縮短訓(xùn)練時(shí)間,擴(kuò)大模型規(guī)模
Ferguson 表示:“NVIDIA 在此方面是一家非常出色的合作伙伴。”
Evozyne 數(shù)據(jù)科學(xué)家 Joshua Moller 表示:“他們通過將工作擴(kuò)展到多個(gè) GPU 來加快訓(xùn)練速度。
這將訓(xùn)練大型 AI 模型的時(shí)間從幾個(gè)月縮短到一個(gè)星期。Ferguson 表示:“所以我們能夠訓(xùn)練出原本不可能訓(xùn)練出的模型,比如一些有數(shù)十億可訓(xùn)練參數(shù)的模型。”
未來將更加令人期待
使用 AI 加速蛋白質(zhì)工程的前景十分廣闊。
Ferguson 注意到了擴(kuò)散模型近期的發(fā)展:“這個(gè)領(lǐng)域的發(fā)展速度快得令人難以置信,我真的很期待日后的進(jìn)一步發(fā)展。”
“沒人知道我們五年后將能夠走多遠(yuǎn)。”
原文標(biāo)題:NVIDIA 和 Evozyne 創(chuàng)建用于生成蛋白質(zhì)的生成式 AI 模型
文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4086瀏覽量
99173
原文標(biāo)題:NVIDIA 和 Evozyne 創(chuàng)建用于生成蛋白質(zhì)的生成式 AI 模型
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
中科曙光聯(lián)合發(fā)布全球首個(gè)蛋白質(zhì)結(jié)構(gòu)智能壓縮與生成AI服務(wù)器Protein-OCR
行業(yè)特定的生成式 AI 能力如何形成:面向中國企業(yè)的場景化解決方案模型
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
不只有AI協(xié)作編程(Vibe Coding):生成式系統(tǒng)級芯片(GenSoC)將如何把生成式設(shè)計(jì)推向硬件層面
NVIDIA Clara開放模型加速科學(xué)與醫(yī)療行業(yè)變革
通過NVIDIA Jetson AGX Thor實(shí)現(xiàn)7倍生成式AI性能
智能體化AI和生成式AI的區(qū)別
生成式 AI 重塑自動(dòng)駕駛仿真:4D 場景生成技術(shù)的突破與實(shí)踐
NVIDIA recsys-examples在生成式推薦系統(tǒng)中的高效實(shí)踐
NVIDIA 和 Evozyne 創(chuàng)建用于生成蛋白質(zhì)的生成式 AI 模型
評論