国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

預測超長蛋白質這事,CPU贏了

英特爾中國 ? 來源:未知 ? 2023-07-08 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

金磊 楊凈 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

AI模型的推理在CPU上完成加速和優(yōu)化,竟然不輸傳統(tǒng)方案?

至少在生命科學和醫(yī)療制藥方向,已經(jīng)透露出這種信號

例如在處理AlphaFold2這類大型模型這件事上,大眾普遍的認知可能就是堆GPU來進行大規(guī)模計算。

但其實從去年開始,CPU便開始苦練內(nèi)功,使端到端的通量足足提升到了原來的23.11倍。

而現(xiàn)如今,CPU讓這個數(shù)值great again——再次提升3.02倍

727bbffe-1d55-11ee-962d-dac502259ad0.png

不論是像抗菌肽這種較短的氨基酸序列,還是像亨氏綜合征蛋白這樣超長的序列,都可以輕松hold住。

而且所有的預測任務,在不考慮最高通量、僅僅是順序執(zhí)行,8個小時就能全部搞定。

72921998-1d55-11ee-962d-dac502259ad0.png

甚至國內(nèi)已經(jīng)有云服務提供商做了類似的優(yōu)化方案:

相比于GPU,基于CPU的加速方案在性價比上更為理想,而且在特定的情況下(超過300或400氨基酸),幾乎只有CPU能把它算完,而GPU的失敗率會很高。

要知道,像AlphaFold2這類任務,可以說是公認的AI for Science標桿。

從上述的種種跡象表明,CPU不再是“你以為的你以為”,而是以一種新勢力進軍于此,并發(fā)揮著前所未有的威力。

CPU,正在大步邁進新時代。

英特爾自己刷新自己

事實上,此次備受關注的CPU加速方案,背后不是別人,正是發(fā)明了CPU的英特爾。

2022年,英特爾以第三代至可擴展處理器為硬件基座,使AlphaFold2通量優(yōu)化提升達23.11倍。一年后,他們在此基礎上,再次實現(xiàn)自我刷新。

2022年,英特爾基于第三代至 可擴展平臺,針對AlphaFold2的設計特點,在預處理、模型推理、后處理三階段實現(xiàn)了端到端優(yōu)化。

73671a4e-1d55-11ee-962d-dac502259ad0.png

如今,原有的五大端到端基礎步驟之上,第四代至 可擴展處理器的加入,再次給AlphaFold2帶來整體推理性能的提升。

此次優(yōu)化方案主要圍繞預處理和模型推理兩個方面,基本劃分為五個步驟。

第一步:預處理階段,借助第三代或第四代至 可擴展處理器的多核優(yōu)勢及其內(nèi)置AVX-512技術,實現(xiàn)針對性的高通量優(yōu)化。

第二步到第五步模型推理階段的優(yōu)化,與2022年方案類似。

第二步,將深度學習模型遷移至面向英特爾 架構優(yōu)化的PyTorch,并逐模塊地從JAX/haiku完成代碼遷移。

第三步,引入JIT圖編譯技術,將網(wǎng)格轉化為靜態(tài)圖,以提高模型推理速度。

第四步,切分注意力模塊和算子融合,即對注意力模塊進行大張量切分的優(yōu)化思路;與此同時,使用IPEX(英特爾 擴展優(yōu)化框架,建議版本為IPEX-2.0.100+cpu或更高)對Einsum和Add兩種算子進行融合。

第五步,借助至 可擴展平臺的計算和存儲優(yōu)勢實施針對性優(yōu)化。比如基于NUMA架構技術,挖掘多核心優(yōu)勢,破解多實例運算過程中的計算和內(nèi)存瓶頸。

不過除了提供更強的基礎算力,第四代至 可擴展平臺還帶來了諸多針對AI工作負載的優(yōu)化加速技術。

具體可以拆分為四項:(詳細優(yōu)化方案可點擊閱讀原文獲取)

一、TPP技術降低推理過程中的內(nèi)存消耗

TPPTensor Processing Primitives)相當于是一種虛擬的張量指令集架構,能讓英特爾 AVX-512等物理指令集予以抽象,生成經(jīng)過優(yōu)化的平臺代碼。

具體到計算執(zhí)行上,TPP能實現(xiàn)兩種優(yōu)化方式:以單指令多數(shù)據(jù)方式處理數(shù)據(jù);優(yōu)化內(nèi)存訪問模式,提升緩存命中率來提高數(shù)值計算和訪存效率。

7387a200-1d55-11ee-962d-dac502259ad0.png

這樣一來,狹長矩陣乘法的空間復雜度從 O (n^2) 降為 O (n) ,運算內(nèi)存峰值也將大幅降低,更有助于處理長序列蛋白結構預測的問題。

二、支持DDR5內(nèi)存與大容量緩存帶來張量吞吐提升

AlphaFold2中大量的矩陣計算過程需要內(nèi)存來支撐,因此內(nèi)存性能影響著整個模型運行性能。

第四代至強 可擴展處理器帶來兩種解決思路——支持DDR5內(nèi)存,以及大容量末級緩存:

一方面,與上個方案DDR4內(nèi)存帶寬25.6GBps (3,200MHz)相比,DDR5內(nèi)存帶寬提升了超50%,達到38.4GBps (4,800MHz)以上 ;另一方面,末級緩存也由上一代的最高 60MB提升至現(xiàn)在最高112.5MB,幅度87.5%。

三、內(nèi)置AI加速引擎AMX

英特爾在第四代至 可擴展處理器中創(chuàng)新內(nèi)置了AI加速器——英特爾 AMX,類似GPU里的張量核心,加速深度學習推理過程并減少存儲空間。

它支持INT8、BF16等低精度數(shù)據(jù)類型,尤其BF16數(shù)據(jù)類型在精度上的表現(xiàn)不遜于FP32數(shù)據(jù)類型,AlphaFold2使用AMX_BF16后,推理時間可縮短數(shù)倍之多。

四、高帶寬內(nèi)存HBM2e增加訪存通量

每個英特爾 至 CPU Max系列,都擁有4個基于第二代增強型高帶寬內(nèi)存 (HBM2e) 的堆棧,總容量為64GB (每個堆棧的容量為16GB)

由于能同時訪問多個DRAM芯片,它可提供高達1TB/s的帶寬。而且配置更靈活,有三種不同模式與DDR5內(nèi)存一起協(xié)同工作:HBM Only、HBM Flat以及HBM Cache。

綜上,第四代英特爾 至 可擴展處理器所帶來的四種優(yōu)化技術讓AlphaFold2的端到端通量得到了再進一步提升,與第三代相比實現(xiàn)了高達3.02倍的多實例通量提升。

73982a08-1d55-11ee-962d-dac502259ad0.png

當然,除了CPU之外,英特爾在探索驗證AlphaFold2優(yōu)化方案、步驟和經(jīng)驗過程中,同樣也能提供其他AI加速芯片,給產(chǎn)業(yè)鏈上的生態(tài)伙伴提供強勁支持。

甚至已經(jīng)給出了行業(yè)備受認可的解決方案。

就在前段時間,英特爾聯(lián)合Github上知名的AI+科學計算的開源項目——Colossal-AI的團隊潞晨科技,成功優(yōu)化了AlphaFold2蛋白質結構預測的性能,并將其方案開源。

基于AI專用加速芯片Habana Gaudi,他們成功將端到端推理速度最高提升3.86倍(相較于此前使用的方案),應用成本相較于GPU方案最多降低39%。

73a6bffa-1d55-11ee-962d-dac502259ad0.jpg

醫(yī)藥和生命科學領域,AI還有何作為?

大模型,毋庸置疑是近來科技圈最為火爆的技術之一。

它憑借自身強算法、多數(shù)據(jù)、大算力的結合所帶來的泛用性,在醫(yī)藥和生命科學領域同樣大步發(fā)展著。

這一過程,AI宛如從破解人類的自然語言,躍進到了破解生命的自然語言

  • 人類自然語言大模型:從26個字母,到詞/句/段。

  • 生命自然語言大模型:從21個氨基酸字母,到蛋白質/細胞/生命體。

那么具體而言,現(xiàn)在AI大模型可能會讓醫(yī)藥和生命科學領域產(chǎn)生怎樣的變革?

我們不妨以百圖生科推出的,世界首個AI大模型驅動的AI生成蛋白平臺AIGP(AI Generated Protein)為例來了解一番。

AIGP背后所依靠的,是一個千億參數(shù)的跨模態(tài)生命科學大模型,通過“挖掘公開數(shù)據(jù)和獨特自產(chǎn)數(shù)據(jù)”、“跨模態(tài)預訓練和科學計算”,以及“蛋白質讀寫系統(tǒng)和細胞讀寫系統(tǒng)”,三大步驟實現(xiàn)對蛋白質空間及生命體的建模。

73fcee48-1d55-11ee-962d-dac502259ad0.png

如此大模型能力之下,百圖生科便具備了一系列給定Protein(抗原),設計與之以特定方式結合的Protein(抗體)的能力。

也因此參與到了一系列前沿藥物的開發(fā),包括高性能免疫調控彈頭設計、難成藥靶點精準設計、定表位抗體彈頭設計、可溶性TCR設計等。

除此之外,百圖生科也具備對給定細胞/細胞組合,發(fā)現(xiàn)調控細胞的有效蛋白靶點/組合,并繼而快速設計調控蛋白的能力。

這就為多種疾病的靶點發(fā)現(xiàn)、耐藥/不響應患者改善、靶點科學線索轉化帶來新的可能。

不過有一說一,百圖生科的例子也是只是AI之于醫(yī)藥、生命科學領域變革的一隅。

但今年生物醫(yī)學領域的著名獎項(加拿大蓋爾德納獎)史無前例地頒給了人工智能科學家、DeepMind創(chuàng)始人Demis Hassabis等人。

這也從側面反映了生命科學、醫(yī)藥領域對于AI的認可,以及更多的期待。

如果您對本文涉及的基于Habana Gaudi與英特爾 至 可擴展處理器對AlphaFold2進行端到端優(yōu)化的技術細節(jié)感興趣,如果您也想了解百圖生科在AIGP領域的最新進展,英特爾《至強實戰(zhàn)課》之《AI驅動的生命科學與醫(yī)藥創(chuàng)新》將為您帶來更加全面且詳細的真人講解,歡迎大家注冊收看~

以及想要了解更多第四代至可擴展平臺對AlphaFold2的優(yōu)化方案,請點擊【閱讀原文】。

742590f0-1d55-11ee-962d-dac502259ad0.jpg


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10301

    瀏覽量

    180472
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11279

    瀏覽量

    225019

原文標題:預測超長蛋白質這事,CPU贏了

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    東軟載波微電子提供基于ES8H0494系列產(chǎn)品的干衣機顯示板方案

    隨著人們對生活品質要求的提高,干衣機已逐漸成為現(xiàn)代家庭的剛需。傳統(tǒng)烘干機的高溫環(huán)境容易破壞衣物的蛋白質纖維,且長時間的高溫烘干會讓棉質衣物變得僵硬,失去柔軟度。干衣機的出現(xiàn)便解決了這些問題,干衣機
    的頭像 發(fā)表于 02-26 10:33 ?504次閱讀
    東軟載波微電子提供基于ES8H0494系列產(chǎn)品的干衣機顯示板方案

    中科曙光聯(lián)合發(fā)布全球首個蛋白質結構智能壓縮與生成AI服務器Protein-OCR

    近日,中科曙光與天目湖健康研究院、ENTROPITech、蘇州大學、北京大學等多家中國頂尖科研機構聯(lián)合發(fā)布了全球首個蛋白質結構智能壓縮與生成AI服務器Protein-OCR。在底層邏輯上
    的頭像 發(fā)表于 02-25 16:27 ?321次閱讀

    算力賦能,打造生命科學云上新范式

    一站式分析服務,輕松應對組學數(shù)據(jù)繁復、分析門檻高、項目協(xié)作難等挑戰(zhàn)。該平臺全面支撐蛋白質結構預測、時空組學、單細胞與基因組數(shù)據(jù)分析等一系列前沿科研,并貫通至精準醫(yī)療等產(chǎn)業(yè)化應用,覆蓋生命科學研究的多元場景,迄今已支持
    的頭像 發(fā)表于 01-12 14:01 ?357次閱讀

    labview如何實現(xiàn)數(shù)據(jù)的采集與實時預測

    現(xiàn)有以下問題:labview可以實現(xiàn)數(shù)據(jù)的采集以及調用python代碼,但如何將這兩項功能集成在一個VI文件里,從而實現(xiàn)數(shù)據(jù)的采集與實時預測。現(xiàn)有條件如下:已完成數(shù)據(jù)的采集系統(tǒng),python中的預測代碼也已經(jīng)訓練封裝完成。
    發(fā)表于 12-03 21:13

    漸凍癥如何真正意義有效無創(chuàng)神經(jīng)調控?

    蛋白質異常聚集、線粒體功能障礙和軸突運輸受損。這些改變共同導致了大腦皮層興奮與抑制回路的失衡,表現(xiàn)為經(jīng)顱磁刺激(TMS)測量中的短間隔皮質內(nèi)抑制(SICI,一種
    的頭像 發(fā)表于 11-15 12:57 ?374次閱讀
    漸凍癥如何真正意義有效無創(chuàng)神經(jīng)調控?

    引領AI圖像識別+營養(yǎng)分析技術!涂鴉AI食物秤方案,端云協(xié)同可分析30萬種食物

    食物的營養(yǎng)成分(如卡路里、蛋白質、碳水化合物等),并在App實現(xiàn)飲食數(shù)據(jù)的記錄、管理與指導建議。這種科學簡單、快速準確的記錄方式,使得AI食物秤在健身人群、慢性病
    的頭像 發(fā)表于 11-07 18:32 ?884次閱讀
    引領AI圖像識別+營養(yǎng)分析技術!涂鴉AI食物秤方案,端云協(xié)同可分析30萬種食物

    NVIDIA Clara開放模型加速科學與醫(yī)療行業(yè)變革

    Clara 為從預測蛋白質結構到設計可在實驗室合成的分子的整個早期藥物發(fā)現(xiàn)流程提供支持。
    的頭像 發(fā)表于 11-06 11:42 ?969次閱讀

    福祿克流量校準系統(tǒng)在生物制藥行業(yè)的應用

    在生物制藥行業(yè),生物反應器和發(fā)酵罐是生產(chǎn)生物制品(如疫苗、單克隆抗體和治療性蛋白質)的核心設備。氧氣、氮氣或二氧化碳等氣體的精密流量控制對于維持細胞生長、代謝和產(chǎn)品產(chǎn)量的最佳條件至關重要。
    的頭像 發(fā)表于 10-31 17:00 ?1542次閱讀

    蜂鳥E203簡單分支預測的改進

    是最簡單的靜態(tài)分支預測,其預測的命中率并不是很高,因此流水線常常需要因為沖刷而浪費很多周期,導致CPU的性能下降。因此,針對題目通過對E203微架構進行優(yōu)化提升處理器性能的要求,我們想到了對其分支
    發(fā)表于 10-24 07:45

    基于全局預測歷史的gshare分支預測器的實現(xiàn)細節(jié)

    GShare預測機制簡介 GShare預測機制作為一種常用的分支預測機制,通過基于分支歷史和分支地址來預測分支指令的執(zhí)行路徑。分支歷史是指處理器在執(zhí)行程序時遇到的所有分支指令的執(zhí)行情
    發(fā)表于 10-22 06:50

    中科曙光超智融合技術重塑生物醫(yī)藥研發(fā)新范式

    當前,海量生物數(shù)據(jù)的處理與分析能力已成為制約行業(yè)發(fā)展的關鍵瓶頸。近日,依托曙光超智融合技術建設的華東某全國產(chǎn)計算中心,與單細胞測序領域代表性企業(yè)墨卓生物達成戰(zhàn)略合作。以強大算力為單細胞測序、蛋白質結構預測及海量臨床樣本分析提供支撐,加速精準診斷進程,重塑生物醫(yī)藥研發(fā)與應用
    的頭像 發(fā)表于 08-11 11:12 ?1129次閱讀

    火極一時的AI蛋白質解析,怎么樣了?

    AI蛋白質解析領域正在經(jīng)歷一場靜水流深的變革
    的頭像 發(fā)表于 07-27 17:18 ?2356次閱讀
    火極一時的AI<b class='flag-5'>蛋白質</b>解析,怎么樣了?

    華為智算實驗室方案加速構建AI4S新質生產(chǎn)力

    當人工智能開始主導蛋白質結構預測、量子系統(tǒng)模擬甚至新型材料發(fā)現(xiàn)時,科學研究的底層邏輯正在經(jīng)歷重大變革。2024年諾貝爾化學獎授予了基于深度學習的分子動力學研究團隊,標志著AI從科研輔助工具正式進化
    的頭像 發(fā)表于 07-05 17:53 ?1857次閱讀
    華為智算實驗室方案加速構建AI4S新質生產(chǎn)力

    《虛擬世界的力學交響曲:Adams如何重塑工業(yè)仿真邊界》

    自動推導出可能的運動約束方案。就像AlphaFold預測蛋白質結構那樣,預見尚未被明確定義的機械行為范式。
    發(fā)表于 06-06 11:36

    太赫茲細胞能量儀主控芯片方案單片機開發(fā)控制板布局規(guī)劃

    毫米以上,可引起人體內(nèi)蛋白質、細胞及水分子共振,深度是一般遠紅外線治療儀的50—100倍。當人體受到太赫茲照射時,由于其頻率與人體中的細胞分子、原子團狀的水分子的運動頻率相一致,引起共振效應,其能量
    發(fā)表于 03-25 15:37