国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ASIC爆火!大廠AI訓練推理拋棄GPU;博通的護城河有多深?

Hobby觀察 ? 來源:電子發燒友 ? 作者:梁浩斌 ? 2024-12-18 01:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/梁浩斌)在上周末,博通應該可以說是投資圈和科技圈最火爆的話題,大家紛紛驚呼“英偉達的對手終于出現了!”“ASIC要超越GPU”云云。

這一切都要源于上周五博通公布的炸裂財報,AI業務營收同比暴增220%,當天公司股價大漲24.43%,市值突破萬億美元,成為第九家市值突破萬億美元的美股上市公司,全球第三家市值超萬億美元的半導體公司。

當然,更重要的是對未來的預期,博通在數據中心高速互連領域有非常大的市場份額,這代表著AI基礎設施的規模增長,博通的部分增長也確實來自以太網網絡部件。但除了高速互連之外,博通還正在與一些大型云服務供應商合作,幫助他們開發定制AI芯片,這部分業務的增長迅速,將會令博通成為英偉達的最大挑戰者。

博通的AI芯片布局

博通的傳統優勢是在高速互連方面,比如數據中心的以太網傳輸中用到的高速光模塊產品組合,還有在高速互連中使用到的高速SerDes內核IP等。而目前博通在AI芯片領域,主要也是提供ASIC解決方案,提供設計、廣泛IP組合、先進封裝等方案,集成了內存、高速SerDes、PCIe接口等IP,以及Arm/Power PC等CPU內核。

ASIC即專用集成電路,顧名思義,與英偉達提供的通用GPU不同,ASIC是專門針對某種場景或應用設計,目前不少云計算巨頭都在使用定制的ASIC作為數據中心的核心芯片。作為一種專用芯片,在設計之初就是為了滿足特定的任務和算法需求,因此在針對算法開發的情況下,計算效率和能效比都能夠相比通用GPU大幅提高。

比如谷歌去年推出的TPU v5e專為提升中大型模型的訓練、推理等任務設計,相比上一代的TPU v4訓練性能提高2倍,推理性能提高2.5倍,但成本只有上一代的一半不到,大幅提升了計算效率以及成本效益。

對于云計算巨頭而言,為了降低對英偉達的依賴,同時也為了降低成本,選擇定制ASIC都會是一個比較確定的方向。除了谷歌之外,亞馬遜、華為、阿里、百度等云計算巨頭都已經有自研數據中心ASIC產品,并已經投入使用。

而博通目前依靠在高速互連方面的關鍵技術,在對互連速率要求極高的AI計算領域就極具優勢。早在2020年,博通推出了公司首款采用臺積電N5工藝的數據中心ASIC,集成了PCIe Gen5協議、112 Gbps SerDes、運行頻率為3.6 Gbps、集成HBM2e,利用TSMC CoWoS Interposer封裝技術實現3.6 Tbps Die2Die PHY IP,幾乎將先進的高速互連技術堆滿。

最近博通還推出了3.5D XDSiP封裝平臺,可以將超過6000平方毫米的3D堆疊硅晶片和12個HBM模塊集成到一個系統級封裝中,同時大幅提升片內互連的性能。

與傳統采用硅通孔TVS的F2B(面到背)的技術相比,3.5D XDSiP采用HCB(混合銅鍵合)以F2F(面對面)的方式將邏輯芯片堆疊,堆疊芯片之間的信號密度提高了7倍;3.5D XDSiP通過利用3D HCB代替平面芯片到芯片物理接口,芯片到芯片接口的功耗降低了90%,還能最大限度地減少3D堆棧中計算、內存和I/O組件之間的延遲。

據稱博通的3.5D XDSiP目前已經被主要的AI領域客戶使用,已經有6款產品正在開發中,博通預計最早在2026年2月實現出貨。其中富士通下一代2nm制程的Arm處理器FUJITSU-MONAKA已經確認使用博通3.5D XDSiP技術,這款處理器面向數據中心、邊緣計算等應用,據此前富士通的介紹,MONAKA每顆CPU包含一個中央的I/O die和四個3D垂直堆疊die,并集成SRAM,預計2027年出貨。

今年9月,博通還展示了一種帶有光學模塊的AI計算ASIC,實現片間光互連。博通在制造中使用了FOWLP封裝技術,將CPO模塊與AI ASIC封裝在一起,大幅降低了系統延遲,還實現了可插拔的激光器設計,便于數據中心維護。

目前來看,在AI計算中極為重要的互連技術上,博通擁有很強大的技術積累,這也為其ASIC定制服務建立了穩固的壁壘。從客戶群來看,博通在財報中透露,目前正在與三家非常大型的云計算客戶開發AI芯片,并預計到2027年,每個客戶都將在網絡集群中部署100萬個AI芯片,屆時市場對定制AI ASIC的需求容量將高達600億-900億美元。

ASIC跑AI,大廠的專屬玩物

最近大廠開發ASIC的消息頻出,在博通公布財報的前一天,就傳出蘋果與博通合作,開發面向AI推理的ASIC芯片,將采用臺積電N3P工藝,計劃在2026年投入生產。而亞馬遜也在月初公布了AI芯片Trn2UltraServer和Amazon EC2Trn2的應用實例,展示出ASIC的應用性價比遠超GPU。

但可能大家也發現,目前定制開發高算力ASIC的廠商,無一例外是云計算大廠,本身公司業務就有極大規模的算力需求。這是由于ASIC的定制費用較高,需要有足夠龐大的規模才能分攤前期定制開發費用。

ASIC定制費用,主要是開發過程中的一次性工程費用,也被業內稱為NRE(Non-Recurring Engineering)。顧名思義,NRE費用只需要支出一次,后續規模生產中不需要再增加這部分費用。

NRE費用中,包含芯片設計的成本,比如研發人員薪酬、EDA工具授權費等,這與芯片使用的制程工藝、芯片本身的復雜程度相關;然后是版圖設計成本,其實這里的概念跟芯片設計的成本類似,主要是涉及芯片的物理布局設計,需要特定的研發人員和軟件支持;再是IP授權費用,一般是一些通用的IP,比如CPU IP、內存控制器、接口IP等。

以定制一款采用5nm制程的ASIC為例,NRE費用可以高達1億至2億美元。然而一旦能夠大規模出貨,NRE費用就可以很大程度上被攤薄。

博通也提到,未來每個客戶將在網絡集群中部署100萬片AI芯片,即使其中只有30萬片是定制的ASIC,那么分攤到每一片芯片上的NRE費用就大約只要300-600美元,相比GPU的成本有明顯的優勢。而據業內人士分析,中等復雜程度的ASIC盈虧平衡點在10萬片左右。

小結:

盡管目前英偉達GPU在AI訓練、推理的應用中還是處于一家獨大的地位,但ASIC的成本效益,讓各大大模型廠商不得不開始考慮轉向ASIC。加上谷歌推出的Gemini2.0已經開始帶頭使用自家的TPU來進行訓練和推理,以往ASIC不適用于AI訓練的刻板印象也逐步被打破。

如果ASIC的成本效益未來能被進一步開發至極致,那么至少像百度、阿里、谷歌、騰訊、華為這樣的集大模型開發和云計算服務于一體的互聯網巨頭,會先擺脫在AI大模型上對GPU的依賴。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 博通
    +關注

    關注

    36

    文章

    4346

    瀏覽量

    109135
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英偉達失守中國區!推理需求爆發,國產GPU搶灘上市

    億元。而在此前,另一家國產GPU公司摩爾線程已于9月26日率先過會。這兩大GPU企業接連沖刺IPO,背后是中國AI算力需求爆發式增長與全球供應鏈格局重塑的多重驅動。 ? AI
    的頭像 發表于 10-22 09:09 ?8182次閱讀
    英偉達失守中國區!<b class='flag-5'>推理</b>需求爆發,國產<b class='flag-5'>GPU</b>搶灘上市

    AI ASIC通份額將達60%,聯發科成長顯著,臺積電成最大贏家

    Counterpoint指出,AI芯片熱潮進入第二階段,ASICGPU競爭激烈,通和臺積電有望成最大贏家。 ? Counterpoint預測,A
    的頭像 發表于 02-05 18:21 ?1.3w次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>ASIC</b>:<b class='flag-5'>博</b>通份額將達60%,聯發科成長顯著,臺積電成最大贏家

    AI推理芯片需求爆發,OpenAI欲尋求新合作伙伴

    領域占據主導,其GPU憑借強大的海量數據處理能力,成為全球AI爆炸式增長的重要基石。但隨著AI不斷演進,重點正從大規模訓練轉向對已訓練模型的
    的頭像 發表于 02-03 17:15 ?1996次閱讀

    開源不是削弱競爭力,而是新護城河的開始

    。 越來越多的企業在開源的浪潮中找到了機會,也有人提出疑問: 既然代碼都開源了,護城河還從哪里來?開源軟件還有壁壘可言嗎? 事實上,開源并不是沒有護城河,它只是 把護城河從“技術代碼”轉移到了“綜合能力” 。 一、開源不是免費的
    的頭像 發表于 11-06 14:26 ?376次閱讀

    AI芯片市場鏖戰,GPUASIC誰將占據主動?

    本文轉自:TechSugar隨著人工智能技術在大模型訓練、邊緣計算、自動駕駛等領域的深度滲透,核心算力硬件的競爭進入白熱化階段。圖形處理單元(GPU)與專用集成電路(ASIC)作為兩大主流技術路線
    的頭像 發表于 10-30 12:06 ?766次閱讀
    <b class='flag-5'>AI</b>芯片市場鏖戰,<b class='flag-5'>GPU</b>與<b class='flag-5'>ASIC</b>誰將占據主動?

    AI推理需求爆發!高通首秀重磅產品,國產GPU的自主牌怎么打?

    10月29日,在安會的2025智能算力應用及產業發展論壇上,超聚變數字技術有限公司深圳解決方案總監丁元釗表示,原來我們預計2026年是AI推理爆發元年,2025年DeepSeek-R1,V3模型
    的頭像 發表于 10-30 00:46 ?1.4w次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>需求爆發!高通首秀重磅產品,國產<b class='flag-5'>GPU</b>的自主牌怎么打?

    一文看懂AI訓練推理與訓推一體的底層關系

    我們正在參加全球電子成就獎的評選,歡迎大家幫我們投票~~~謝謝支持很多人聽過“大模型”,但沒搞懂兩件事。我們總說AI有多強,但真正決定AI能否落地的,是它的兩個階段:訓練(Training)和
    的頭像 發表于 09-19 11:58 ?2415次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>訓練</b>、<b class='flag-5'>推理</b>與訓推一體的底層關系

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,FPGA屬于AI芯片這個
    發表于 09-12 16:07

    睿海光電以高效交付與廣泛兼容助力AI數據中心800G光模塊升級

    推理任務響應延遲降低30%,多租戶帶寬隔離效率提升25%。 亞洲頭部智算中心:采用睿海定制化液冷光模塊,GPU集群訓練效率提升18%,PUE值優化至1.1以下。 歐洲車企AI
    發表于 08-13 19:01

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    網絡智能診斷平臺。通過對私有化網絡數據的定向訓練,信而泰打造了高性能、高可靠性的網絡診斷模型,顯著提升了AI輔助診斷的精準度與實用性。該方案實現了網絡全流量深度解析能力與AI智能推理
    發表于 07-16 15:29

    陣列云從訓練推理

    在云場景下,陣列云(分布式計算集群)從模型訓練推理的完整技術流程可結構化分解如下: 一、訓練階段技術實現 1,資源動態編排? 基于Kubernetes集群或云廠商彈性計算服務(如AWS EC2
    的頭像 發表于 03-28 08:32 ?666次閱讀

    摩爾線程GPU原生FP8計算助力AI訓練

    并行訓練推理,顯著提升了訓練效率與穩定性。摩爾線程是國內率先原生支持FP8計算精度的國產GPU企業,此次開源不僅為AI
    的頭像 發表于 03-17 17:05 ?1525次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8計算助力<b class='flag-5'>AI</b><b class='flag-5'>訓練</b>

    一夜的DeepSeek一體機,如何改寫AI游戲規則?

    一夜的DeepSeek一體機,如何改寫AI游戲規則? 過去一個多月,科技圈有個“新晉頂流”C位出道,名字叫DeepSeek一體機。 它到什么程度? 朋友圈不斷刷屏,有人調侃:“沒
    的頭像 發表于 03-11 15:52 ?1203次閱讀
    一夜<b class='flag-5'>爆</b><b class='flag-5'>火</b>的DeepSeek一體機,如何改寫<b class='flag-5'>AI</b>游戲規則?

    又一個中國AI產品Manus刷屏 中國AI新星Manus 全網搶邀請碼

    Manus 的 AI 產品在科技圈一夜,全球首款通用智能體Manus開啟內測,據說現在很多的網友都在求Manus邀請碼。而Manus
    的頭像 發表于 03-06 14:09 ?1855次閱讀

    無法調用GPU插件推理的遠程張量API怎么解決?

    運行了使用 GPU 插件的遠程張量 API 的推理。但是,它未能共享 OpenCL* 內存,但結果不正確。
    發表于 03-06 06:13