国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基因組學(xué)大型語言模型在多項任務(wù)中均展現(xiàn)出卓越的性能和應(yīng)用擴(kuò)展空間

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-01-17 01:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

InstaDeep、慕尼黑工業(yè)大學(xué)(TUM)和 NVIDIA 之間的合作推動了面向基因組學(xué)的多超級計算規(guī)模的基礎(chǔ)模型開發(fā)進(jìn)程。這些模型在大量預(yù)測任務(wù)(例如啟動子和增強(qiáng)子位點預(yù)測)中展示了最先進(jìn)的性能。

f0209c2e-95bd-11ed-bfe3-dac502259ad0.jpg

這一聯(lián)合團(tuán)隊的研究指出,經(jīng)過基因組學(xué)訓(xùn)練的大型語言模型(LLM)可將應(yīng)用擴(kuò)展到大量基因組學(xué)任務(wù)。

該團(tuán)隊使用 NVIDIA 的超級計算機(jī) Cambridge-1 來訓(xùn)練參數(shù)規(guī)模從 500M 到 2.5B 不等的各種大型語言模型(LLM)。這些模型在各種基因組數(shù)據(jù)集上進(jìn)行了訓(xùn)練,以探索模型規(guī)模和數(shù)據(jù)多樣性對下游任務(wù)性能的影響。

分類任務(wù)包括預(yù)測增強(qiáng)子和啟動子序列以及轉(zhuǎn)錄因子結(jié)合位點。這些任務(wù)有助于了解 DNA 如何轉(zhuǎn)錄生成 RNA 和蛋白質(zhì),從而開啟新的臨床應(yīng)用。

研究中明確了 20 項任務(wù)。對于每一項任務(wù),性能都隨著模型規(guī)模和數(shù)據(jù)集多樣性的增加而單調(diào)遞增。參照專門的最新模型基線,在多物種數(shù)據(jù)集上訓(xùn)練的具有最大參數(shù)規(guī)模(2.5B 參數(shù))的大型語言模型在 19 項任務(wù)中的 15 項中取得了同等或更高的性能。

這些結(jié)果是通過利用參數(shù)輕量化微調(diào)實現(xiàn)的。然而,即使依靠從 Transformer 模型各層提取的預(yù)訓(xùn)練嵌入以及簡單的淺層感知器(MLP)或邏輯回歸,也足以在 11 個任務(wù)中實現(xiàn)同等乃至更高的性能。

在每個模型檢查點和每個任務(wù)的所有層上應(yīng)用這種探測策略,訓(xùn)練出了 120 萬個 MLP 模型。該研究對大型語言模型的訓(xùn)練和使用等各方面進(jìn)行了詳細(xì)分析,例如不同層對下游任務(wù)性能的影響。

在固定模型規(guī)模下直接比較序列多樣性,顯示出具有重要意義的性能提升,增加模型規(guī)模也是如此。例如,對于一個 500M 參數(shù)模型,僅在人類參考基因組上訓(xùn)練的性能不如在 1000 基因組數(shù)據(jù)集上訓(xùn)練的性能。

同樣,在 1000 基因組數(shù)據(jù)集上訓(xùn)練的 2.5B 參數(shù)模型的性能優(yōu)于任何 500M 參數(shù)模型。而對于相同的模型,性能會遜于在自定義多物種數(shù)據(jù)集上訓(xùn)練的結(jié)果,即使下游性能是在僅涉及人類基因組的任務(wù)上測量的。

研究人員觀察到,并非所有嵌入都是平等創(chuàng)建的。雖然通常的做法建議使用大型語言模型的最后一層進(jìn)行下游預(yù)測。但耐人尋味的是,中間層產(chǎn)生的表征在下游任務(wù)中顯示出明顯更高的性能。研究人員發(fā)現(xiàn),最佳層的選擇取決于任務(wù),表明不同類型的 DNA 特征被不同層的模型所捕獲。

InstaDeep 首席執(zhí)行官 Karim Beguir 表示:“我們相信這些結(jié)果首次清楚地證明了基因組學(xué)基礎(chǔ)模型的可行性,這些模型能夠真正地推廣到多項任務(wù)中。這些結(jié)果從很多方面反映出了過去幾年內(nèi)適應(yīng)性基礎(chǔ)模型在自然語言處理方面的發(fā)展進(jìn)程。如今,其應(yīng)用于藥物研發(fā)和人類健康等如此具有挑戰(zhàn)性的問題,著實令人難以置信的興奮。”

NVIDIA 的 Cambridge-1 對該項目的成功至關(guān)重要。該項目需要高性能計算基礎(chǔ)設(shè)施來訓(xùn)練具有捕獲基因組中遠(yuǎn)程相互作用所需感受域的大型模型。

研究人員嘗試了多種方法、數(shù)據(jù)集大小、模型規(guī)模和分詞器方案,最終使用在 16 個 NVIDIA DGX A100 節(jié)點(128 個 A100 80GB GPU)上訓(xùn)練的 2.5B 參數(shù)稀疏注意力模型,在多任務(wù)上實現(xiàn)了迄今公開發(fā)表的最佳性能。

在未來的研究工作中,該團(tuán)隊計劃通過直接微調(diào)模型,探索進(jìn)一步的下游任務(wù)性能改進(jìn),并將繼續(xù)在應(yīng)用于基因組學(xué)的大型語言模型的架構(gòu)創(chuàng)新方面展開合作。InstaDeep 是首批使用 Cambridge-1 的 NVIDIA 初創(chuàng)加速計劃成員之一。

掃描下方海報二維碼,即可免費(fèi)注冊 GTC 23,切莫錯過這場 AI 和元宇宙時代的技術(shù)大會


原文標(biāo)題:基因組學(xué)大型語言模型在多項任務(wù)中均展現(xiàn)出卓越的性能和應(yīng)用擴(kuò)展空間

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4087

    瀏覽量

    99182

原文標(biāo)題:基因組學(xué)大型語言模型在多項任務(wù)中均展現(xiàn)出卓越的性能和應(yīng)用擴(kuò)展空間

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深入解析ISL6539:雙PWM控制器的卓越性能與應(yīng)用設(shè)計

    、SDRAM、圖形芯片等應(yīng)用展現(xiàn)出卓越性能。 文件下載: ISL6539CAZ.pdf 一、ISL6539概述 ISL6539是一款
    的頭像 發(fā)表于 03-05 17:00 ?323次閱讀

    商湯科技正式開源空間智能模型日日新SenseNova-SI-1.3

    商湯科技正式開源空間智能模型日日新SenseNova-SI-1.3,空間測量、視角轉(zhuǎn)換、綜合推理等核心任務(wù)
    的頭像 發(fā)表于 02-10 14:12 ?341次閱讀
    商湯科技正式開源<b class='flag-5'>空間</b>智能<b class='flag-5'>模型</b>日日新SenseNova-SI-1.3

    郎特科技 LED 筒燈:在辦公、酒店、家居場景卓越表現(xiàn)

    郎特科技LED筒燈:在辦公、酒店、家居場景卓越表現(xiàn)在當(dāng)今對照明品質(zhì)要求日益提升的時代,郎特科技LED筒燈憑借其出色的性能與多樣化的功能,在辦公、酒店、家居等不同場景
    的頭像 發(fā)表于 02-06 12:37 ?345次閱讀
    郎特科技 LED 筒燈:在辦公、酒店、家居場景<b class='flag-5'>中</b>的<b class='flag-5'>卓越</b>表現(xiàn)

    探索DS90UR903Q/DS90UR904Q:FPD - Link II芯片卓越性能與應(yīng)用

    探索DS90UR903Q/DS90UR904Q:FPD - Link II芯片卓越性能與應(yīng)用 電子工程師的日常工作,選擇合適的芯片
    的頭像 發(fā)表于 12-24 10:10 ?325次閱讀

    第十二屆全國功能基因組學(xué)高峰論壇在京舉辦:聚焦人工智能與多組學(xué)融合發(fā)展

    時維金秋,群賢畢至。2025年第十二屆全國功能基因組學(xué)高峰論壇(FGC-12)近日北京圓滿落幕。本屆論壇匯聚了包括60余位國內(nèi)頂尖學(xué)者在內(nèi)的近500名科研院所、高等院校及行業(yè)代表,圍繞“融匯
    的頭像 發(fā)表于 11-19 17:05 ?538次閱讀
    第十二屆全國功能<b class='flag-5'>基因組學(xué)</b>高峰論壇在京舉辦:聚焦人工智能與多組<b class='flag-5'>學(xué)</b>融合發(fā)展

    一文了解Mojo編程語言

    ,利用硬件加速提升效率。 科學(xué)計算與數(shù)據(jù)處理 高效處理大規(guī)模數(shù)值分析、基因組學(xué)數(shù)據(jù)等任務(wù)。 系統(tǒng)工具開發(fā) 開發(fā)操作系統(tǒng)級工具,結(jié)合 Python 的便捷性和 C 的性能優(yōu)勢。 嵌入式與實時應(yīng)用 適用于
    發(fā)表于 11-07 05:59

    亞馬遜云科技宣布推出Qwen3與DeepSeek-V3.1模型的完全托管服務(wù)

    的多種模型選項。DeepSeek-V3.1在數(shù)學(xué)、編程和Agentic任務(wù)方面展現(xiàn)出卓越性能。 · 與專有模型不同,開放權(quán)重
    的頭像 發(fā)表于 09-19 10:11 ?850次閱讀

    性能卓越的國產(chǎn)精密運(yùn)放CYA37全面兼容OP37

    CYA37是一款高性能精密運(yùn)算放大器,其不僅實現(xiàn)了與OP37的全面兼容,更在多項關(guān)鍵性能展現(xiàn)出顯著優(yōu)勢,為工程師提供了更卓越、更可靠的國產(chǎn)
    的頭像 發(fā)表于 09-04 14:36 ?1089次閱讀
    <b class='flag-5'>性能</b><b class='flag-5'>卓越</b>的國產(chǎn)精密運(yùn)放CYA37全面兼容OP37

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】+混合專家

    的基礎(chǔ)上,對數(shù)據(jù)進(jìn)行更深入、更細(xì)致的挖掘。Deepseek的模型架構(gòu),這種協(xié)作使得模型既能處理大規(guī)模的通用數(shù)據(jù),又能應(yīng)對復(fù)雜多樣的特殊情況,展現(xiàn)
    發(fā)表于 07-22 22:14

    中科曙光構(gòu)建全國產(chǎn)化基因組學(xué)性能計算平臺

    近日,中科曙光承建的國內(nèi)某研究所基因組學(xué)性能計算平臺正式交付。這是國內(nèi)生物信息學(xué)領(lǐng)域首個從底層硬件到上層軟件實現(xiàn)完全自主可控,并深度融合高性能計算與人工智能算力的平臺,成功填補(bǔ)了該領(lǐng)
    的頭像 發(fā)表于 06-26 17:36 ?1014次閱讀

    CMD236C4寬帶MMIC SP6T(單刀六擲)射頻開關(guān)Qorvo原裝現(xiàn)貨

    10GHz時展現(xiàn)出卓越的射頻性能,僅2.5dB的低插入損耗和高達(dá)42dB的隔離度,使其成為通信、軍事和航天系統(tǒng)的理想選擇。性能參數(shù)頻率范圍:覆蓋 DC 到 18 GHz。插入損耗:低至
    發(fā)表于 06-09 08:53

    小白學(xué)模型:從零實現(xiàn) LLM語言模型

    在當(dāng)今人工智能領(lǐng)域,大型語言模型(LLM)的開發(fā)已經(jīng)成為一個熱門話題。這些模型通過學(xué)習(xí)大量的文本數(shù)據(jù),能夠生成自然語言文本,完成各種復(fù)雜的
    的頭像 發(fā)表于 04-30 18:34 ?1307次閱讀
    小白<b class='flag-5'>學(xué)</b>大<b class='flag-5'>模型</b>:從零實現(xiàn) LLM<b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    東軟醫(yī)療大模型覆蓋眾多應(yīng)用場景

    近日,國際數(shù)據(jù)公司(IDC)發(fā)布《中國醫(yī)療大模型技術(shù)評估,2025》(Doc#CHC51586524,2025年4月)報告,指出當(dāng)前中國醫(yī)療大模型廣泛的醫(yī)療場景
    的頭像 發(fā)表于 04-14 17:04 ?1133次閱讀

    多智能體仿真中的統(tǒng)一混合模型框架研究

    隨著GPT大語言模型的成功,越來越多的工作嘗試使用類GPT架構(gòu)的離散模型來表征駕駛場景的交通參與者行為,從而生成多智能體仿真。這些方法展現(xiàn)出
    的頭像 發(fā)表于 04-01 14:31 ?829次閱讀
    多智能體仿真中的統(tǒng)一混合<b class='flag-5'>模型</b>框架研究

    SMA接口:如何在有限空間內(nèi)實現(xiàn)卓越射頻連接

    提供了全方位保障。無論是小型消費(fèi)電子設(shè)備,還是復(fù)雜的通信基礎(chǔ)設(shè)施,德索制造的 SMA 接口都展現(xiàn)出強(qiáng)大的適應(yīng)性與可靠性,為現(xiàn)代電子設(shè)備的高效運(yùn)行奠定了堅實基礎(chǔ)
    的頭像 發(fā)表于 03-21 10:48 ?1078次閱讀
    SMA接口:如何在有限<b class='flag-5'>空間</b>內(nèi)實現(xiàn)<b class='flag-5'>卓越</b>射頻連接