国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ASIC芯片:全球玩家及競爭格局

架構師技術聯盟 ? 來源:架構師技術聯盟 ? 2023-05-15 15:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

頭部廠商紛紛切入AI ASIC領域,技術路徑不同。

谷歌15年發布第一代TPU(ASIC)產品,TPU產品持續迭代升級。英特爾19年收購人工智能芯片公司Habana Labs,22年發布AI ASIC芯片Gaudi 2,性能表現出色;IBM研究院22年底發布AI ASIC芯片AIU,有望23年上市;三星第一代AIASIC芯片Warboy NPU芯片已于近日量產。

頭部廠商紛紛切入 AI ASIC領域,看好ASIC在人工智能領域的長期成長性。

谷歌:谷歌為AI ASIC芯片的先驅,于15年發布第一代TPU(ASIC)產品,大幅提升AI推理的性能;17年發布TPU v2,在芯片設計層面,進行大規模架構更新,使其同時具備AI推理和AI訓練的能力;谷歌TPU產品持續迭代升級,21年發布TPU v4,采用7nm工藝,峰值算力達275TFLOPS,性能表現全球領先。

英特爾:19年底收購以色列人工智能芯片公司Habana Labs,22年發布Gaudi 2 ASIC芯片。從架構來看,Gaudi架構擁有雙計算引擎(MME和TPC),可以實現MME和TPC并行計算,大幅提升計算效率;同時,其將RDMA技術應用于芯片互聯,大幅提升AI集群的并行處理能力;從性能來看,Gaudi 2在ResNET-50、BERT、BERT Phase-1、BERT Phase-2模型的訓練吞吐量優于英偉達A100,性能表現優異。

頭部廠商紛紛切入AI ASIC領域,技術路徑不同。本文內容來自“GPT-5后NLP大模型逐步走向收斂,ASIC將大有可為”,詳細介紹谷歌——全球AI ASIC先驅,TPU產品持續迭代,以及英特爾——收購Habana Lab,Gaudi 2性能表現出色。

1、ASIC具有性能高、體積小、功率低等特點

ASIC具有性能高、體積小、功率低等特點。AI芯片指專門用于運行人工智能算法且做了優化設計的芯片,為滿足不同場景下的人工智能應用需求,AI芯片逐漸表現出專用性、多樣性的特點。根據設計需求,AI芯片主要分為中央處理器CPU)、圖形處理器(GPU)、現場可編程邏輯門陣列(FPGA)、專用集成電路(ASIC)等,相比于其他AI芯片,ASIC具有性能高、體積小、功率低等特點。

CPU-》GPU-》ASIC,ASIC成為AI芯片重要分支。

1)CPU階段:尚未出現突破性的AI算法,且能獲取的數據較為有限,傳統CPU可滿足算力要求;

2)GPU階段:2006年英偉達發布CUDA架構,第一次讓GPU具備了可編程性,GPU開始大規模應用于AI領域;

3)ASIC階段:2016年,Google發布TPU芯片(ASIC類),ASIC克服了GPU價格昂貴、功耗高的缺點,ASIC芯片開始逐步應用于AI領域,成為AI芯片的重要分支。

a073239e-f2cf-11ed-90ce-dac502259ad0.png

ASIC芯片在推理領域具有明顯優勢,有望在該領域率先出現爆品。根據CSET數據,ASIC芯片在推理領域優勢明顯,其效率和速度約為CPU的100-1000倍,相較于GPU和FPGA具備顯著競爭力。盡管ASIC芯片同樣可以應用于訓練領域(例如TPU v2、v3、v4),但我們認為其將在推理領域率先出現爆品。

a08cd06e-f2cf-11ed-90ce-dac502259ad0.png

預計ASIC在AI芯片的占比將大幅提升。根據McKinsey Analysis數據,在數據中心側,25年ASIC在推理/訓練應用占比分別達到40%、50%;在邊緣側,25年ASIC在推理/訓練應用占比分別達到70%、70%,ASIC在AI芯片的占比將大幅提升。

a0a318b0-f2cf-11ed-90ce-dac502259ad0.png

2、多種類AI芯片并存,頭部廠商紛紛切入ASIC領域

多種類AI芯片并存,頭部廠商紛紛切入ASIC領域。

英偉達延續GPU路線,22年發布H100芯片,目前廣泛應用于云端訓練和推理;

AMD利用自身技術積累,將CPU和GPU集成在一起,推出Instinct MI300芯片,預計23年H2上市。

頭部廠商開始切入ASIC領域,Google為AI ASIC芯片的先驅,21年推出TPU v4,運算效能大幅提升;英特爾19年收購Habana Lab,22年推出Gaudi2 ASIC芯片;IBM、三星等頭部廠商亦紛紛切入ASIC領域。

a0b4cce0-f2cf-11ed-90ce-dac502259ad0.png

3、谷歌:全球AI ASIC先驅,TPU產品持續迭代;性能表現,A100《TPU v4《H100

谷歌為全球AI ASIC先驅,TPU產品持續迭代。谷歌2015年發布TPU v1,與使用通用CPU和GPU的神經網絡計算相比,TPU v1帶來了15~30倍的性能提升和30~80倍的能效提升,其以較低成本支持谷歌的很多服務,僅可用于推理;17年發布TPU v2,用于加速大量的機器學習和人工智能工作負載,包括訓練和推理;18年發布TPU v3,算力和功率大幅增長,其采用了當時最新的液冷技術;20年和21年分別發布TPU v4i和v4,應用7nm工藝,晶體管數大幅提升,算力提升,功耗下降。

a0cee06c-f2cf-11ed-90ce-dac502259ad0.png

TUP v4性能表現優于英偉達A100。TPU v4的性能表現在BERT、ResNet、DLRM、RetinaNet、MaskRCNN下分別為A100的1.15x、1.67x、1.05x、1.87x和1.37x,性能表現優于英偉達A100。

TUP v4性能表現略遜于H100,但功耗管理能力出色。根據《AI and ML Accelerator Survey and Trends》數據,英偉達H100的峰值性能表現高于TUP v4,而TUP v4作為ASIC芯片,在功耗管理方面表現出色,峰值功率低于H100。

a0f01e76-f2cf-11ed-90ce-dac502259ad0.png

4、谷歌:TPU v1架構

統一緩沖器(Unified Buffer)和矩陣乘法單元(MMU)占據53%的芯片總面積。TPU v1主要包括統一緩沖器(Unified Buffer)、矩陣乘法單元(MMU)、累加器(Accumulators)、激活流水線電路(Activation Pipeline)、DDAM等,其中統一緩沖器和矩陣乘法單元面積占比最高,合計達53%。

TPU v1工作流程:

1)芯片啟動,緩沖區和DDR3為空;

2)用戶加載TPU編譯的模型,將權重放入DDR3內存;

3)主機用輸入值填充激活緩沖區;

4)發送控制信號將一層權重加載到矩陣乘法單元;

5)主機觸發執行,激活并通過矩陣乘法單元傳播到累加器;

6)通過激活流水線電路,新層替換緩沖區的舊層;

7)重復步驟4-7,直到最后一層;

8)最后一層的激活被發送給主機。

a10a0534-f2cf-11ed-90ce-dac502259ad0.png

5、谷歌:TPU v2架構,基于TPU v1的大規模架構更新

a13559dc-f2cf-11ed-90ce-dac502259ad0.png

TPU v2內核數增加值2個。TPU v1僅有1個Tensor Core,導致管道更為冗長。TPU v2的內核數增加為2個,對編譯器也更為友好。

MXU利用率提升。TPU v1的MXU包含256*256個乘積累加運算器,由于部分卷積計算規模小于256*256,導致單個大核的利用率相對較低;而TPU v2的單核MXU包含128*128個乘積累加運算器,在一定程度上,提升了MXU利用率。

a1585ec8-f2cf-11ed-90ce-dac502259ad0.png

6、谷歌:TPU v3延續v2架構,性能提升,TDP優化

谷歌TPU v3延續v2架構,性能提升。TPU V3在v2架構的基礎上,矩陣乘法單元(MXU)數量提升翻倍,時鐘頻率加快30%,內存帶寬加大30%,HBM容量翻倍,芯片間帶寬擴大了30%,可連接的節點數為先前4倍,性能大幅提升。

采用液冷技術,TDP優化。TPU v3采用液冷技術,峰值算力為TPU v2的2.67倍,而TDP僅為TPU v2的1.61倍,TDP大幅優化。

7、谷歌:TPU v4,硬件性能進一步提升

MXU數量翻倍,峰值算力大幅提升。從硬件提升來看,根據Google Cloud數據,TPU v4芯片包含2個TensorCore,每個TensorCore包含4個MXU,是TPUv3的2倍;同時,HBM帶寬提升至1200 GBps,相比上一代,提升33.33%。從峰值算力來看,TPU v4的峰值算力達275 TFLOPS,為TPU v3峰值算力的2.24倍。

a1766ab2-f2cf-11ed-90ce-dac502259ad0.png

谷歌的超級計算機構想:將4*4*4(64)個TPU v4芯片連接成1個立方體結構(Cube),再將4*4*4個立方體結構(Cube)連接成共有4096個TPU v4芯片的超級計算機,其中物理距離較近TPU v4芯片(即同一個Cube中的4*4*4個芯片)采用常規電互聯方式,距離較遠的TPU(例如Cube之間的互聯)間用光互連。采用光互連技術可以有效避免“芯片等數據”的情形出現,進而提升計算效率。

可重配置光互連技術可以進一步提升計算性能。谷歌TPU v4通過加入光路開關(OCS)的方式,可以根據具體模型數據流來調整TPU之間的互聯拓撲,實現最優性能,可重配置光互連技術可以將性能提升至先前的1.2-2.3倍。

可重配置光互連技術提升計算機的穩定性。若計算機中部分芯片出現故障,可以通過該技術繞過故障芯片,進而不會影響整個系統的工作。

a18e5794-f2cf-11ed-90ce-dac502259ad0.png

8、英特爾:Gaudi架構實現MME和TPC并行運算

英特爾收購Habana Lab。Habana Labs成立于2016年,總部位于以色列,是一家為數據中心提供可編程深度學習加速器廠商,2019年發布第一代Gaudi。英特爾于2019年底收購Habana Lab,旨在加快其在人工智能芯片領域的發展,2022年發布Gaudi 2。

Gaudi架構實現MME和TPC并行運算。Gaudi架構包含2個計算引擎,即矩陣乘法引擎(MME)和TPC(張量處理核心);Gaudi架構使得MME和TPC計算時間重疊,進行并行運算,進而大幅提升計算效率。

Gaudi 2延續上一代架構,硬件配置大幅提升。Gaudi 2架構基本與上一代相同,TPC數量從8個提升至24個,HBM數量從4個提升至6個(總內存從32GB提升至96GB),SRAM存儲器提升一倍,RDMA從10個提升至24個,同時集成了多媒體處理引擎,硬件配置大幅提升。

a1a87160-f2cf-11ed-90ce-dac502259ad0.png

RDMA技術用于芯片互聯,大幅提升并行處理能力。RDMA是一種遠端內存直接訪問技術,具有高速、超低延遲和極低CPU使用率的特點。Gaudi將RDMA集成在芯片上,用于實現芯片間互聯,大幅提升AI集群的并行處理能力;同時,Gaudi支持通用以太網協議,客戶可以將Gaudi放入現有的數據中心,使用標準以太網構建AI集群。

Gaudi 2性能表現出色。根據《Habana Gaudi 2 White Paper》披露數據,Gaudi 2在ResNET-50、BERT、BERT Phase-1、BERT Phase-2模型的訓練吞吐量分別為A100(40GB,7nm)的2.0、2.4、2.1、3.3x,性能表現出色。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54010

    瀏覽量

    466073
  • asic
    +關注

    關注

    34

    文章

    1274

    瀏覽量

    124587
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265374

原文標題:ASIC芯片:全球玩家及競爭格局

文章出處:【微信號:架構師技術聯盟,微信公眾號:架構師技術聯盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI ASIC:博通份額將達60%,聯發科成長顯著,臺積電成最大贏家

    電子發燒友報道(文/李彎彎)在人工智能芯片領域,專用集成電路(ASIC)正崛起。隨著AI算力需求爆發,ASIC憑借定制化、高效能等優勢,在數據中心、AI推理等場景競爭力強勁。研究公司
    的頭像 發表于 02-05 18:21 ?1.3w次閱讀
    AI <b class='flag-5'>ASIC</b>:博通份額將達60%,聯發科成長顯著,臺積電成最大贏家

    突發,208億元并購!全球MEMS格局巨變!

    (CMM)業務出售給 Syntiant Corp,售價為1.5億美元 (約合10.58億元人民幣),一個MEMS聲學傳感器時代落下帷幕。 ? 今日(2月3日),又一宗改變全球MEMS產業格局的并購案被
    的頭像 發表于 02-03 19:16 ?251次閱讀
    突發,208億元并購!<b class='flag-5'>全球</b>MEMS<b class='flag-5'>格局</b>巨變!

    中興通訊崔麗分析全球AI產業競爭格局變化

    1月22日,由《財經》雜志主辦、《哈佛商業評論》承辦的“甦·新商業盛典2026”在香港舉行。中興通訊首席發展官崔麗受邀出席“AI產業全球格局與投資參考”主題圓桌對話,圍繞AI產業發展趨勢及相關能力建設等話題,分享了中興通訊的思考與實踐。
    的頭像 發表于 01-26 10:34 ?652次閱讀

    南柯電子|汽車電子EMC測試系統:“亞太”主導下的技術競爭格局

    南柯電子|汽車電子EMC測試系統:“亞太”主導下的技術競爭格局
    的頭像 發表于 01-20 09:45 ?201次閱讀

    微弱信號采集 ASIC芯片 CBM12AD1X

    ASIC芯片
    芯佰微電子
    發布于 :2025年11月28日 15:04:53

    AI芯片市場鏖戰,GPU與ASIC誰將占據主動?

    本文轉自:TechSugar隨著人工智能技術在大模型訓練、邊緣計算、自動駕駛等領域的深度滲透,核心算力硬件的競爭進入白熱化階段。圖形處理單元(GPU)與專用集成電路(ASIC)作為兩大主流技術路線
    的頭像 發表于 10-30 12:06 ?768次閱讀
    AI<b class='flag-5'>芯片</b>市場鏖戰,GPU與<b class='flag-5'>ASIC</b>誰將占據主動?

    愛芯元智亮相2025全球AI芯片峰會

    2025全球AI芯片峰會(GACS 2025)近日在上海召開,愛芯元智聯合創始人、副總裁劉建偉出席活動,并于“大模型AI芯片專題論壇”發表主題演講,分享了公司如何憑借高智價比AI芯片
    的頭像 發表于 09-26 15:49 ?973次閱讀

    標準更新頻率如何影響電能質量在線監測裝置的市場競爭格局

    LZ-DY-8三相電壓監測儀 標準更新頻率通過 技術壁壘重構、供應鏈洗牌、區域市場分化、國際競爭格局重塑 四大機制,深刻改變了電能質量在線監測裝置的市場競爭格局。以下結合行業實踐與數據
    的頭像 發表于 09-03 16:45 ?734次閱讀
    標準更新頻率如何影響電能質量在線監測裝置的市場<b class='flag-5'>競爭</b><b class='flag-5'>格局</b>?

    硅光芯片技術突破和市場格局

    產業格局的核心技術。2025年全球硅光芯片市場規模預計突破80億美元,中國廠商在技術突破與商業化進程中展現出強勁競爭力。 ? 硅光芯片技術突
    的頭像 發表于 08-31 06:49 ?2.1w次閱讀

    AI芯片,需要ASIC

    電子發燒友網報道(文/李彎彎) 2025年,全球AI芯片市場正迎來一場結構性變革。在英偉達GPU占據主導地位的大格局下,ASIC(專用集成電路)憑借針對AI任務的定制化設計,成為推動算
    的頭像 發表于 07-26 07:30 ?6777次閱讀

    從14nm到3nm:AI ASIC算力、能效雙突破

    電子發燒友網報道(文/李彎彎)2025年,全球AI芯片市場正迎來一場結構性變革。在英偉達GPU占據主導地位的大格局下,ASIC(專用集成電路)憑借針對AI任務的定制化設計,成為推動算力
    的頭像 發表于 07-26 07:22 ?6825次閱讀

    四大核心要素驅動汽車智能化創新與相關芯片競爭格局

    當下,功能安全、高效高靈活性的算力、產品生命周期,以及軟件生態兼容性這“四大核心要素”,已成為衡量智能汽車AI芯片創新力和市場競爭力的核心標準。
    的頭像 發表于 07-01 14:49 ?680次閱讀

    第三方激光雷達ASIC方案,能改變行業格局嗎?

    進行系統設計。 ? 而近年隨著激光雷達市場的爆發式增長,激光雷達降本的節奏加速,我們也看到激光雷達有自研芯片的趨勢,包括接收端的SPAD和處理端的SoC或ASIC,逐漸放棄了FPGA。但自研芯片也意味著高成本,目前只有行業頭部企
    的頭像 發表于 06-07 01:11 ?8061次閱讀
    第三方激光雷達<b class='flag-5'>ASIC</b>方案,能改變行業<b class='flag-5'>格局</b>嗎?

    競爭格局看 M12 航空插頭行業走向

    競爭格局審視,M12航空插頭行業未來將在技術創新的持續賦能下,不斷開拓新的應用領域,朝著更高性能、更小型化、更能適應復雜惡劣環境的方向穩健前行。在此過程中,企業唯有持續提升自身核心競爭力,方能在激烈的市場
    的頭像 發表于 05-28 09:02 ?439次閱讀
    從<b class='flag-5'>競爭</b><b class='flag-5'>格局</b>看 M12 航空插頭行業走向

    全球芯片產業進入2納米競爭階段:臺積電率先實現量產!

    隨著科技的不斷進步,全球芯片產業正在進入一個全新的競爭階段,2納米制程技術的研發和量產成為了各大芯片制造商的主要目標。近期,臺積電、三星、英特爾以及日本的Rapidus等公司紛紛加快了
    的頭像 發表于 03-25 11:25 ?1415次閱讀
    <b class='flag-5'>全球</b><b class='flag-5'>芯片</b>產業進入2納米<b class='flag-5'>競爭</b>階段:臺積電率先實現量產!