国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Exaflop簡史

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-08-03 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可至少進行百億億次浮點運算。

為了解決這個時代最復雜的問題,比如如何治療像新冠肺炎和癌癥這樣的疾病、以及如何緩解氣候變化等。計算機的計算量正在不斷增加。

所有這些重大挑戰將計算帶入了現今的百億億次級時代,頂級性能通常以 exaflops 來衡量。

什么是 Exaflop?

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可以至少進行 10^18 或百億億次浮點運算。

Exaflop 中的 exa-前綴表示“百億億”,即 10 億乘以 10 億或1的后面有 18 個零。同樣,單個 exabyte 的內存子系統可以儲存百億億字節的數據。

exaflop 中的“flop”是浮點運算的縮寫。exaflop/s 是表示系統每秒浮點運算次數的單位。

浮點是指所有數字都用小數點表示的計算方法。

1000 Petaflop = 1 Exaflop

前綴 peta- 表示 10^15,即 1 的后面有 15 個零。因此 1 exaflop 等于 1000 petaflop。

c4a277d0-1263-11ed-ba43-dac502259ad0.png

1 exaflop 的計算量到底有多大?相當于十億人中的每個人都拿著十億個計算器。

如果他們同時按下等號,就是進行了 1 個 exaflop。

擁有 Big Red 200 和其他幾臺超級計算機的印第安納大學表示,exaflop 計算機的速度相當于一個人每秒鐘進行一次計算,并一直計算 31,688,765,000 年。

Exaflop 簡史

在超級計算發展史的大部分時間里,一次浮點運算就是一次,但隨著工作負載引入 AI ,這種情況也發生了變化。

人們開始使用最高的精度格式來表示數字,這種格式被稱為雙精度,由 IEEE 浮點運算標準定義。它之所以被稱為雙精度或 FP64,是因為計算中的每個數字都需要以 64 位用 0 或 1 表示的數據塊表示,而單精度為 32 位。

雙精度使用 64 位確保每個數字都精確到很細微的部分,比如 1.0001 + 1.0001 = 2.0002,而不是 1 + 1 = 2。

這種格式非常適合當時的大部分工作負載,比如從原子到飛機等全部需要確保模擬結果接近于真實的模擬。

因此,當 1993 年全球最強大的超級計算機榜單 TOP500 首次發布時,衡量 FP64 數學性能的 LINPACK 基準(又稱HPL)自然成為了默認的衡量標準。

AI 大爆炸

十年前,計算行業發生了 NVIDIA 首席執行官黃仁勛所說的 AI 大爆炸。

這種強大的新計算形式開始在科學和商業應用上展現出重大成果,而且它運用了一些非常不同的數學方法。

深度學習并不是模擬真實世界中的物體,而是在堆積如山的數據中篩選,以找到能夠帶來新洞察的模式。

這種數學方法需要很高的吞吐量,所以用經過簡化的數字(比如使用 1.01 而不是 1.0001)進行大量計算要比用更復雜的數字進行少量計算好得多。

因此 AI 使用 FP32、FP16 和 FP8 等低精度格式,通過 32 位、16 位和 8 位數讓用戶更快地進行更多計算。

混合精度不斷發展

AI 使用 64 位數就如同在周末外出時帶著整個衣柜。

研究人員一直在積極地為 AI 尋找理想的低精度技術。

例如首個 NVIDIA Tensor Core GPU——Volta,它使用了混合精度,并以 FP16 格式執行矩陣乘法,然后用 FP32 累積結果以獲得更高的精度。

Hopper 通過 FP8 加速

最近,NVIDIA Hopper 架構首次發布了速度更快的低精度 AI 訓練方法。Hopper Transformer Engine 能夠自動分析工作負載,盡可能采用 FP8 并以 FP32 累積結果。

在進行計算密集度較低的推理工作,比如在生產中運行 AI 模型時,TensorFlow 和 PyTorch 等主要框架通過支持 8 位整數實現快速性能,因為這樣就不需要使用小數點來完成工作。

好消息是,NVIDIA GPU 支持上述所有精度格式,因此用戶可以實現每個工作負載的最優加速。

去年,IEEE P3109 委員會開始為機器學習中使用的精度格式制定行業標準。這項工作可能還需要一到兩年的時間才能完成。

一些模擬軟件在低精度工作中大放異彩

雖然 FP64 在模擬工作中仍然很受歡迎,但當低精度數學能夠更快提供可用結果時,許多人會使用后者。

c4d88d16-1263-11ed-ba43-dac502259ad0.png

影響 HPC 應用程序性能的因素各不相同

例如,研究人員用 FP32 運行廣受歡迎的汽車碰撞模擬器——Ansys LS-Dyna。基因組學也傾向于使用低精度數學。

此外,許多傳統的模擬開始在部分工作流程中采用 AI。隨著越來越多的工作負載使用 AI,超級計算機需要支持較低的精度才能有效運行這些新興應用。

基準與工作負載同步發展

在認識到這些變化后,包括 Jack Dongarra(2021 年圖靈獎得主和 HPL 的貢獻者)在內的研究人員在 2019 年首次發布了 HPL-AI,這項新基準更適合測量新的工作負載。

Dongarra 在 2019 年的博客中表示:“無論是技術不斷優化的傳統模擬,還是 AI 應用,混合精度技術對于提高超級計算機的計算效率越來越重要。正如 HPL 實現了對雙精度能力的基準測試一樣,這種基于 HPL 的新方法可以對超級計算機的混合精度能力進行大規模基準測試。”

尤利希超級計算中心主任 Thomas Lippert 同意了這一觀點。

他在去年發表的一篇博客中表示:“我們使用 HPL-AI 基準是因為它既能夠準確地衡量日益增加的 AI 和科學工作負載中的混合精度工作,也能反映準確的 64 位浮點計算結果。”

現今的 Exaflop 系統

在 6 月的一份報告中,全球 20 個超級計算機中心提交了 HPL-AI 結果,其中有三個中心提供了超過 1 exaflop 的性能。

在這些系統中,橡樹嶺國家實驗室的超級計算機在 HPL 上的 FP64 性能也超過了 1 exaflop。

c517a064-1263-11ed-ba43-dac502259ad0.png

2022 年 6 月 HPL-AI 結果的采樣器

兩年前,一非傳統系統首次達到 1 exaflop。這臺由 Folding@home 聯盟組裝的眾源超級計算機在呼吁幫助抵御新冠疫情后,達到了這一里程碑,到現在已有超過 100 萬臺計算機加入其中。

理論和實踐中的Exaflop

許多組織從那時起就已開始安裝理論峰值性能超過 1 exaflop 的超級計算機。需要注意的是,TOP500 榜單同時發布 Rmax(實際)和 Rpeak(理論)分數。

Rmax 指計算機實際表現出的最佳性能。

Rpeak 是一切系統都處于高水平運行時的最高理論性能,而這幾乎從未發生過。該數值的計算方法通常是將系統中的處理器數量乘以其時鐘速度,然后再將結果乘以處理器在一秒鐘內可執行的浮點運算數。

因此,如果有人說他們的系統達到 1 exaflop,請詢問他說的是 Rmax(實際)還是Rpeak(理論)。

Exaflop 時代的眾多指標

這也是新百億億次時代的眾多細微變化之一。

值得注意的是,HPL 和 HPL-AI 屬于合成基準,即它們衡量的是數學程序的性能,而不是真實世界的應用。MLPerf 等其他基準則基于真實世界中的工作負載。

最后,衡量系統性能的最佳標準當然是它運行用戶應用程序的情況。該衡量標準不是基于 exaflop,而是基于投資回報率。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109744
  • 計算機
    +關注

    關注

    19

    文章

    7807

    瀏覽量

    93203
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301431

原文標題:什么是 Exaflop?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    H200之后,美國AI芯片管制再出“幺蛾子”,英偉達和AMD慌嗎?

    電子發燒友網報道(文 / 吳子鵬)3 月 6 日,知情人士向媒體透露,美國商務部工業與安全局(BIS)已起草 AI 芯片出口管制新規草案,擬將現行覆蓋約 40 個國家和地區的限制措施擴展至全球范圍。這意味著英偉達、AMD 等美國芯片廠商向全球任何目的地出口 AI 加速器,均需事先獲得美國政府許可。 ? 美國政府正在考慮的這項新規,將從根本上改變其在 AI 芯片出口管制領域的角色 —— 從對特定國家實施限制,轉變為充當全球 AI 產業的 “守門人”。 ? 美
    的頭像 發表于 03-07 06:08 ?1288次閱讀

    7 天快速落地!全品類無刷電動工具驅動方案,一次性過?EMC?認證

    做無刷電動工具的廠家,90%都踩過這個致命的坑:產品樣機調試完成、性能完全達標,卻卡在EMC認證上,反復改板3個月,錯過了產品上市的黃金窗口,前期幾十萬的研發投入打了水漂。深耕無刷電機驅動領域多年的其利天下,在服務上百家電動工具生產廠家的過程中發現:超85%的EMC認證整改失敗,根源都在于底層無刷電動工具驅動方案的前期設計存在先天缺陷,而非后期簡單整改就能解
    的頭像 發表于 03-07 14:00 ?266次閱讀
    7 天快速落地!全品類無刷電動工具驅動方案,一次性過?EMC?認證

    5.5v 0.22f的超級電容 功率多少

    你是否曾為給超級電容充電而擔憂?或擔心高壓、大電流沖擊器件?隨著物聯網、可穿戴設備和智能傳感網絡的廣泛應用,超級電容憑借超快充電、長壽命和高功率輸出的特性,正在成為“短時功率補充 + 重復循環”的首選方案。
    的頭像 發表于 03-07 09:15 ?474次閱讀
    5.5v 0.22f的超級電容 功率多少

    手持無刷電動工具驅動方案:低功耗設計與續航優化全解析

    在手持無刷電動工具的市場競爭中,續航能力是用戶購買決策的核心指標,也是廠家破局同質化競爭的關鍵。而一款產品的續航上限,核心取決于底層無刷電動工具驅動方案的低功耗設計能力。深耕無刷電機驅動領域多年的其利天下,在服務上百家電動工具廠家的過程中發現:超80%的手持鋰電工具續航短板,根源并非電池容量不足,而是無刷電動工具驅動方案的功耗設計存在缺陷。很多廠家陷入“續航
    的頭像 發表于 03-07 09:00 ?484次閱讀
    手持無刷電動工具驅動方案:低功耗設計與續航優化全解析

    SambaNova發布第五代RDU AI芯片,專為智能體推理工作負載設計

    電子發燒友網報道,近期,美國人工智能硬件及軟件研發公司SambaNova宣布推出其第五代RDU可重構數據流單元AI芯片SN50芯片,同時推出基于該芯片的SambaRack SN50風冷機架系統。SN50芯片專為智能體推理工作負載設計,具備超低延遲、高吞吐量和節能等突出特性,性能更是達到上代產品的5倍。在存儲結構上,它采用大容量內存 + HBM + SRAM的三層次架構,極大優化了時延表現。 ? 與英偉達的產品相比,SN50表現亮眼。在Llama 3.3 70B模型上,其最大速度是英偉達B200
    的頭像 發表于 03-07 06:18 ?788次閱讀

    虛擬電廠:正在落地的電力AI應用

    提到電廠,人們往往聯想到高聳的煙囪與轟鳴的發電機組,但虛擬電廠卻打破了這一固有印象,它沒有實體廠房,卻能通過數字技術聚合分散的綠電資源,成為保障電網穩定、助力企業降本的電力AI應用。 ? 近日,福建首個縣域虛擬電廠,閩清縣域虛擬電廠啟動建設運營籌備,項目整合水口水電站等區域綠電,將為當地數智算電產業園的2000P智算業務提供穩定綠電,這不僅是福州虛擬電廠產業集群擴容的關鍵一步,更折射出虛擬電廠在新型電力系統中的重
    的頭像 發表于 03-07 06:17 ?788次閱讀

    湖北發布傳感器產業發展行動方案 劍指2030年帶動5000億應用規模

    3月2日,《加快“世界光谷”傳感器產業集群融合發展行動方案(2026—2030年)》正式發布,明確提出到2030年帶動傳感器應用行業規模突破5000億元,打造國內一流傳感器產業基地。該方案聚焦技術研發、企業培育、場景應用和產業生態四大維度,計劃通過五大行動18項重點任務推動產業跨越式發展。 《加快“世界光谷”傳感器產業集群融合發展行動方案(2026-2030年)》發布會現場 根據方案部署,湖北將組建光谷智能傳感技術創新研究院,圍繞材料、工藝
    的頭像 發表于 03-06 18:11 ?1297次閱讀
    湖北發布傳感器產業發展行動方案 劍指2030年帶動5000億應用規模

    四方光電:2025年營收突破10億元

    近日,四方光電股份有限公司(688665)公布2025年度業績快報公告,報告期內,公司營業收入102,690.83萬元,同比增長17.61%;歸屬于母公司所有者的凈利潤13,165.56萬元,同比增加16.76%。 2025年度主要財務數據和指標 報告期的經營情況、財務狀況? 報告期內,公司營業收入102,690.83萬元,同比增長17.61%;歸屬于母公司所有者的凈利潤13,165.56萬元,同比增加16.76%。報告期末,公司總資產174,490.47萬元,比期初增長12.31%;歸屬于母公司的所有者權益115,407.84萬元,比期初
    的頭像 發表于 03-06 18:09 ?1281次閱讀
    四方光電:2025年營收突破10億元

    嵌入式開發工具的現狀和發展簡史

    集成開發環境(IDE)正在經歷深刻變革。傳統意義上披著“圖形界面”外衣的編譯器,已不再能滿足當今的需求。隨著嵌入式系統變得越來越強大,而且AI開始融入幾乎所有設計中,開發者需要的是能夠理解開發者工作內容的開發環境。新一代IDE應能幫助駕馭復雜性,強化安全性,并讓軟件開發工作更加輕松愉悅。
    的頭像 發表于 11-11 09:49 ?1200次閱讀

    一文讀懂京東技術發展簡史

    文章目錄 前言 京東發展歷程 京東商城技術的演進 京東自研技術 京東前端框架Nerv 京東后端架構 京東的服務框架 分布式數據庫StarDB 京東云 移動端 Flutter在京東的實踐 大數據 咚咚架構 ShardingSphere 京東人物譜 參考 “京東可以高速發展到今天的規模的原因,其中最核心的是堅持“倒三角”戰略:建立出色的團隊;打造財務、物流和技術三大核心系統;降低成本、提升效率;為用戶帶來最佳體驗。在《京東技術解密》一書中,大家會看到技術驅動的力量,
    的頭像 發表于 11-10 13:53 ?873次閱讀

    物聯網20年簡史

    二十年前, “萬物互聯” 還只是一個概念。 二十年后,它已深入能源、制造、交通、醫療、農業等每一個行業的神經末梢。 物聯網(IoT)不再是“未來”,而是工業世界的“底座”。 今天,就讓我們一起穿越時間的浪潮,回望物聯網的二十年演變之路。 一、2005-2010:概念萌芽期 關鍵詞:傳感器網絡、RFID、M2M 這五年,是“物聯網”被正式提出的階段。2005年,**國際電信聯盟(ITU)**首次提出“IoT”概念,標志著萬物互聯的構想進入公眾視野。 當時的
    的頭像 發表于 10-28 11:36 ?598次閱讀
    物聯網20年<b class='flag-5'>簡史</b>

    人形機器人進化簡史

    最近火爆全網的機器人格斗直播,盡管有很多瑕疵,賽博朋克感依然讓人驚呼科幻走入現實。
    的頭像 發表于 07-18 14:58 ?1905次閱讀

    《電子發燒友電子設計周報》聚焦硬科技領域核心價值 第13期:2025.05.26--2025.05.30

    標準簡史; IEEE Std 802.3df 和 IEEE P802.3dj 標準的更新; 助力下一代超大規模數據中心; 3、前沿技術公開課--知存科技+知名高校教授打造存內計算系列課程 (值得
    發表于 05-30 19:39

    機器人和自動化的未來(1)

    時代的到來,不僅標志著技術的飛躍,也預示著社會結構和生活方式的巨大變革。1.1機器人簡史:從幻想到現實談到機器人,人們很容易
    的頭像 發表于 04-19 08:34 ?663次閱讀
    機器人和自動化的未來(1)

    五金清洗機的簡史與未來發展趨勢解析

    想象一下,身處在繁忙的工業車間里,金屬零件堆積如山,等待著清洗。你或許會問:“這些金屬零件如何才能恢復到如新般的光澤?”這就要提到五金清洗機的神奇之處。它不僅能高效清潔,還象征著工業發展的智能化與自動化。今天,讓我們一起走進五金清洗機的歷史長河,探索它的演變、技術進步以及未來的發展趨勢。五金清洗機的誕生背景和歷史沿革五金清洗機并非一夕之間的產物,它的誕生與工
    的頭像 發表于 04-10 16:33 ?925次閱讀
    五金清洗機的<b class='flag-5'>簡史</b>與未來發展趨勢解析