国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

IBM 新款高能效 AI 芯片:能效比高過 NVIDIA A100

工程師鄧生 ? 來源:芯東西 ? 作者:溫淑 ? 2021-02-19 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2 月 18 日報道,本屆集成電路設計領域頂會 “國際固態電路會議(ISSCC 2021)”正在進行中(2021 年 2 月 13 日到 22 日)。作為已有近 70 年歷史的集成電路產學屆盛會,ISSCC 2021 亦被許多廠商視為發布其領先芯片技術的權威舞臺。

本屆會議上,IBM 發表了據稱是 “全球首款”的高能效 AI 芯片,該芯片采用 7nm 制程工藝,可達到 80% 以上的訓練利用率和 60% 以上的推理利用率,而通常情況下,GPU 的利用率在 30% 以下。

性能參數方面,IBM 新品的運算密度高于同樣采用 7nm 工藝的 NVIDIA A100 GPU;其在多種精度下的整數運算性能,還優于聯發科 7nm 專用 AI 芯片等產品。

據 IBM 官網分享,其新款 7nm 高能效 AI 芯片該款芯片在多種場景中均有較好的應用前景,比如,可用于混合云環境中的低能耗 AI 訓練、或用于實現更接近邊緣的云端訓練等。

一、IBM 新款高能效 AI 芯片:能效比高過 NVIDIA A100

對比結果顯示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韓國科學院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平頭哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、聯發科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮點運算次數,分別達到 16TFLOPS 和 25.6TFLOPS;運算密度分別為 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分別為 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的運算密度分別為 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分別為 16.5TOPS/W 和 8.9TOPS/W。

對比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮點運算次數,分別為 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比為 1.4TFLOPS/W。

另外,在 7nm 芯片陣營中,NVIDIA A100 GPU 在 fp16 精度下的能效比為 0.78TFLOPS/W,在 int4 精度下的能效比為 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片與同類產品的性能參數對比

二、采用 IBM 自研超低精度訓練 / 推理設計

IBM 官網文章寫道,其新款 AI 芯片之所以能夠兼顧能效和性能,是因為該芯片支持超低精度混合 8 位浮點格式((HFP8,hybrid FP8)。這是 IBM 于 2019 年發布的一種高度優化設計,允許 AI 芯片在低精度下完成訓練任務和不同 AI 模型的推理任務,同時避免任何質量損失。

據悉,目前 IBM 將超低精度混合 8 位浮點格式用于訓練、超低精度混合 4 位浮點格式用于推理,并開發了數據通信協議,以提升多核心 AI 芯片上不同核心間的數據交換效率。

據 IBM 官網文章,自 2015 年起,該公司每年將芯片的功耗性能提升 2.5 倍。這背后,IBM 致力于實現算法、架構、軟件堆棧等各方面的創新。

▲ IBM 在低精度 AI 訓練、推理方面的研究歷程

除了采用超低精度混合 8 位浮點格式外,IBM 新款高能效 AI 芯片添加了電源管理功能。IBM 研究顯示,在同等功率的情況下,通過減緩計算階段的功率消耗,可以最大限度地提升芯片性能。

結語:AI 發展對芯片能耗提出更高要求

隨著智能化浪潮席卷各個領域,AI 模型的復雜性日趨提高。相應地,AI 應用的能源消耗水平亦水漲船高。這一背景下,如何最大限度提升能效,成為 AI 芯片設計玩家們面臨的重要命題。

IBM 通過采用超低精度混合 8 位浮點格式和內置電源管理功能,為其新款 AI 芯片實現了業界領先的高能效。但是,這一芯片尚未實現規模化量產,仍有待市場檢驗。

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54014

    瀏覽量

    466284
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1868

    瀏覽量

    77016
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109778
  • AI
    AI
    +關注

    關注

    91

    文章

    39805

    瀏覽量

    301479
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    安森美多系列功率器件產品助力突破AI數據中心瓶頸

    隨著 AI 算力需求的爆發式增長,數據中心正面臨功率密度激增、能耗加劇及行業效率標準日趨嚴苛的多重考驗。作為功率器件領域的領導廠商,安森美(onsemi)如何助力客戶突破瓶頸,以下通過安森美專家的核心回復,快速聚焦公司的技術
    的頭像 發表于 01-24 17:04 ?2196次閱讀

    基于NVIDIA模組與軟件套件推動邊緣與機器人AI推理

    1200 FP4 TFLOPs 的 AI 算力和 64 GB 內存,在性能、和可擴展性之間實現了理想平衡。憑借高能設計和量產就緒的形
    的頭像 發表于 01-14 09:46 ?552次閱讀
    基于<b class='flag-5'>NVIDIA</b>模組與軟件套件推動邊緣與機器人<b class='flag-5'>AI</b>推理

    專為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致

    昆侖芯K100邊緣AI加速卡以75W超低功耗實現128 TOPS的INT8算力,重新定義邊緣推理標準。其半高半長設計搭載8GB HBM內存與256GB/s帶寬,支持INT8至FP3
    的頭像 發表于 12-14 11:12 ?2942次閱讀
    專為邊緣而生:深度解析昆侖芯K<b class='flag-5'>100</b> <b class='flag-5'>AI</b>加速卡,釋放128 TOPS極致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    高能、低功耗、小體積,炬芯科技發布全新CGM連續血糖監測方案

    及數字健康設備提供小體積、低功耗、高能的解決方案 ,為醫療級連續血糖監測系統提供可靠的硬件基礎。 隨著數字醫療與生理數據監測需求不斷發展,傳統CGM設備在功耗、體積及無線傳輸性能上仍面臨挑戰。炬芯科技憑借在低功耗無線通信與系統級
    的頭像 發表于 12-01 16:57 ?760次閱讀
    <b class='flag-5'>高能</b><b class='flag-5'>效</b>、低功耗、小體積,炬芯科技發布全新CGM連續血糖監測方案

    新手小白必看!關于A100云主機租用,你想知道的一切都在這!

    最通俗易懂的語言,為你準備了一份超詳細的A100云主機租用新手指南,幫你掃清所有障礙,輕松開啟AI之旅。Q1:A100云主機到底是什么?我租了得到什么?把它想象成一
    的頭像 發表于 10-31 19:24 ?1598次閱讀
    新手小白必看!關于<b class='flag-5'>A100</b>云主機租用,你想知道的一切都在這!

    NVIDIA AI技術在節能和氣候中的應用

    最新研究強調了高能基礎設施和 AI 模型如何推動氣候、能源等領域的創新。
    的頭像 發表于 10-13 11:05 ?850次閱讀

    氮化硼有“涼”方,解決AI數據中心的困境 | 晟鵬科技

    AI算力爆發的“熱情”與困境人工智能技術的飛速發展推動全球進入智能算力時代。ChatGPT、Sora等大模型的廣泛應用,使得數據中心的計算需求呈指數級增長。單個AI訓練服務器的功率
    的頭像 發表于 08-26 09:42 ?1180次閱讀
    氮化硼有“涼”方,解決<b class='flag-5'>AI</b>數據中心的<b class='flag-5'>能</b><b class='flag-5'>效</b>困境 | 晟鵬科技

    Cadence攜手NVIDIA革新功耗分析技術

    Cadence 全新 Palladium Dynamic Power Analysis 應用程序助力 AI/ML 芯片和系統設計工程師打造高能設計,縮短產品上市時間。
    的頭像 發表于 08-20 17:53 ?1334次閱讀

    CNC設備狀態與監控平臺解決方案

    制造業中,CNC(計算機數控)設備作為核心生產工具,其運行狀態與水平直接關系到生產效率、產品質量及運營成本。傳統CNC設備管理依賴人工巡檢與經驗判斷,存在數據采集不及時、設備故障預警滯后、
    的頭像 發表于 08-16 13:35 ?744次閱讀

    水泵(電機數采)物聯網解決方案

    隨著國家“雙碳”目標的提出,對于新建或改擴建水處理項目,在采購機泵時,應同時約定水泵和電機能,以最大限度節能減排。其中,水泵效率、電機能表示其將電能轉化為機械
    的頭像 發表于 08-08 14:31 ?827次閱讀
    水泵<b class='flag-5'>能</b><b class='flag-5'>效</b>(電機數采)物聯網解決方案

    NVIDIA助力AI超級計算機Isambard-AI投入使用

    英國布里斯托大學的超級計算機 Isambard-AI 采用 NVIDIA Grace Hopper 超級芯片,其 AI 算力達到了 21 ExaFLOPS,不僅是英國最快的系統,同時也
    的頭像 發表于 07-28 15:07 ?1247次閱讀

    佐航BYQ3712PK變壓器等級測試儀:以精準測量賦配電變壓器升級

    在“雙碳”目標推動下,高效節能的配電變壓器已成為電力系統降本增效的關鍵環節。而準確判定變壓器等級,是推廣節能產品、淘汰低效設備的核心前提。佐航推出的BYQ3712PK變壓器等級
    的頭像 發表于 06-27 13:35 ?763次閱讀
    佐航BYQ3712PK變壓器<b class='flag-5'>能</b><b class='flag-5'>效</b>等級測試儀:以精準測量賦<b class='flag-5'>能</b>配電變壓器<b class='flag-5'>能</b><b class='flag-5'>效</b>升級

    優化電機控制以提高能

    機器人及工廠自動化設備密布的工業環境,電機已成為不可或缺的動力核心。 與能耗 根據美國能源信息署數據,全球約50%的能源消耗來自電機系統,而在工業領域,這一比例更高達80%。以2022年美國為例
    發表于 06-11 09:57

    比和算力提升的衡量方法

    一、比的衡量方法 定義與計算公式? 比(EER)定義為制冷量與輸入功率的比值,計算公式為:?EER = Q / W?(Q為制冷量,W為輸入功率)。公制單位通常采用kW/W,英制
    的頭像 發表于 04-28 07:47 ?3271次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b>比和算力提升的衡量方法

    線性充電與開關充電:環保與的考量

    從環保和角度出發,比較線性充電和開關充電的特點。
    的頭像 發表于 03-18 15:45 ?1029次閱讀
    線性充電與開關充電:環保與<b class='flag-5'>能</b><b class='flag-5'>效</b>的考量