国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA 、 Arm和Intel發布FP8標準化規范作為AI的交換格式

星星科技指導員 ? 來源:NVIDIA ? 作者:Shar Narasimhan ? 2022-10-11 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能處理需要跨硬件和軟件平臺的全棧創新,以滿足神經網絡日益增長的計算需求。提高效率的一個關鍵領域是使用較低精度的數字格式來提高計算效率,減少內存使用,并優化互連帶寬。

為了實現這些好處,業界已經從 32 位精度轉換為 16 位,現在甚至是 8 位精度格式。 transformer 網絡是人工智能中最重要的創新之一,尤其受益于 8 位浮點精度。我們相信,擁有一種通用的交換格式將使硬件和軟件平臺的快速發展和互操作性得以提高,從而推動計算。

NVIDIA 、 ArmIntel 聯合撰寫了一份白皮書 FP8 Formats for Deep Learning ,描述了 8 位浮點( FP8 )規范。它提供了一種通用的格式,通過優化內存使用來加速人工智能的開發,并適用于人工智能訓練和推理。此 FP8 規格有兩種變體, E5M2 和 E4M3 。

該格式在 NVIDIA 料斗體系結構中本地實現,并在初始測試中顯示出出色的結果。它將立即受益于更廣泛的生態系統所做的工作,包括 AI 框架,為開發者實現它。

兼容性和靈活性

FP8 通過硬件和軟件之間的良好平衡,最大限度地減少了與現有 IEEE 754 浮點格式的偏差,以利用現有實現,加快采用速度,并提高開發人員的生產力。

E5M2 使用五位表示指數,兩位表示尾數,是一種截斷的 IEEE FP16 格式。在需要更高精度而犧牲某些數值范圍的情況下, E4M3 格式進行了一些調整,以擴展用四位指數和三位尾數表示的范圍。

新格式節省了額外的計算周期,因為它只使用 8 位。它可以用于人工智能訓練和推理,而不需要在精度之間進行任何重鑄。此外,通過最小化與現有浮點格式的偏差,它為未來 AI 創新提供了最大的自由度,同時仍堅持當前的慣例。

高精度訓練和推理

測試提議的 FP8 格式顯示,在廣泛的用例、架構和網絡中,其精度相當于 16 位精度。變壓器、計算機視覺和 GAN 網絡的結果都表明, FP8 訓練精度與 16 位精度相似,但可以顯著提高速度。有關精度研究的更多信息,請參閱 FP8 Formats for Deep Learning 白皮書。

pYYBAGNE42eAKKP8AACCv9ceJTc299.png

圖 1.語言模型人工智能培訓

在圖 1 中,不同的網絡使用不同的精度度量( PPL 和 Loss ),如圖所示。

pYYBAGNE42eAQ7-PAAAgaylpKC0333.png

圖 2.語言模型 AI 推理

在人工智能行業領先的基準 MLPerf Inference v2.1 中, NVIDIA Hopper 利用這種新的 FP8 格式在 BERT 高精度模型上實現了 4.5 倍的加速,在不影響精度的情況下獲得了吞吐量。

走向標準化

NVIDIA 、 Arm 和 Intel 以開放、無許可證的格式發布了此規范,以鼓勵行業廣泛采用。他們還將向 IEEE 提交該提案。

通過采用一種保持準確性的可互換格式,人工智能模型將在所有硬件平臺上持續高效地運行,并有助于推動人工智能的發展。

鼓勵標準機構和整個行業

關于作者

Shar Narasimhan 是 AI 的高級產品營銷經理,專門從事 NVIDIA 的 Tesla 數據中心團隊的深度學習培訓和 OEM 業務。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9553

    瀏覽量

    391935
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109759
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265436
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SK海力士與閃迪公司啟動HBF全球標準化制定工作

    SK海力士(或‘公司’)26日宣布,于當地時間25日在美國加利福尼亞州米爾皮塔斯的閃迪公司總部,與閃迪公司聯合舉辦“HBF規格標準化聯盟啟動會”,正式發布面向AI推理時代的下一代存儲器解決方案HBF(High Bandwidth
    的頭像 發表于 02-28 16:23 ?231次閱讀

    進迭時空發布新一代RISC-V AI CPU芯片,滿足端側大模型算力需求

    FP8數據精度原生AI推理,還是首顆完整支持芯片級虛擬的RISC-V產品。 ? 硬件配置上,K3配備8顆高性能X100大核,主頻2.4GHz,單核性能與
    的頭像 發表于 01-30 14:06 ?8378次閱讀

    廣電計量參編多項國家標準與計量技術規范發布

    近日,國家市場監督管理總局、國家標準化管理委員會以及工業和信息部相繼發布多項國家標準、行業計量技術規范,其中廣電計量參與編寫1項國家
    的頭像 發表于 01-13 09:41 ?543次閱讀

    廣凌標準化考場建設方案的核心模塊

    一套完整的校園標準化考場建設方案,不僅是技術的集成,更是教育公平與現代治理的體現。通過智能、綠色的手段,標準化考場體系為考試安全筑起堅
    的頭像 發表于 11-07 18:10 ?285次閱讀
    廣凌<b class='flag-5'>標準化</b>考場建設方案的核心模塊

    廣凌標準化考場整體解決方案解析:構建智慧考場新標桿

    在國家教育考試日益規范化的背景下,標準化考點建設已成為保障考試公平、提升管理效率的關鍵舉措。廣凌科技(廣凌股份)深耕教育信息領域27年,憑借AI、5G、物聯網等前沿技術,推出
    的頭像 發表于 10-31 15:17 ?1097次閱讀
    廣凌<b class='flag-5'>標準化</b>考場整體解決方案解析:構建智慧考場新標桿

    NVIDIA Spectrum-X 以太網交換機助力 Meta 和 Oracle 加速網絡性能

    基于?NVIDIA Spectrum-X 以太網交換機的 AI 數據中心網絡。 Meta 和 Oracle 正將 Spectrum-X 以太網交換
    的頭像 發表于 10-14 10:26 ?1811次閱讀
    <b class='flag-5'>NVIDIA</b> Spectrum-X 以太網<b class='flag-5'>交換</b>機助力 Meta 和 Oracle 加速網絡性能

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態系統兼容的低功耗 AI 模塊

    。它是開源硬件,我們已在線發布設計文檔,包括原理圖和接口定義。其異構計算架構兼容 NVIDIA Jetson Nano 接口標準,非常適合邊緣計算、AI 推理、VR/AR、智能 NVR
    發表于 10-11 09:08

    標準化考場是什么?

    很多現在都在建設標準化考場,標準化考場究竟是什么呢?
    的頭像 發表于 09-05 16:45 ?1553次閱讀
    <b class='flag-5'>標準化</b>考場是什么?

    廣凌標準化考場建設整體解決方案——全力維護高考安全公平考試環境

    近日,教育部發布消息,全國公安機關會同教育部門持續高壓打擊涉考違法犯罪活動,已偵破一批組織考試作弊和涉考詐騙案件,全力保障高考安全公平環境。在此背景下,標準化考場建設作為防范作弊、維護考試秩序的核心
    的頭像 發表于 06-06 09:58 ?996次閱讀
    廣凌<b class='flag-5'>標準化</b>考場建設整體解決方案——全力維護高考安全公平考試環境

    廣凌高校標準化考場建設解決方案

    在教育信息與考試安全雙重驅動下,標準化考場建設已成為高校提升考試管理水平的核心抓手。作為深耕教育信息領域的高新技術企業,??廣凌科技(廣凌股份)憑借“高校
    的頭像 發表于 05-29 17:04 ?742次閱讀
    廣凌高校<b class='flag-5'>標準化</b>考場建設解決方案

    摩爾線程發布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    , 支持原生FP8數據類型,支持PyTorch 2.5.0 ,并通過多項針對MUSA計算平臺的性能優化,進一步提升了對AI模型和大規模數據處理的支持能力。 FP8原生支持,國產GPU的技術突破
    的頭像 發表于 05-11 16:41 ?1695次閱讀

    禾賽科技引領全球激光雷達標準化建設

    日前,由國家市場監督管理總局、國家標準化管理委員會批準,禾賽作為牽頭單位及第一起草單位主持編制的《車載激光雷達國家標準GB/T 45500-2025》正式發布并實施。該
    的頭像 發表于 05-06 16:17 ?783次閱讀

    瑞為技術牽頭制定的國家標準《信息技術 可擴展的生物特征識別數據交換格式 第1部分:框架》正式發布

    圖像、步態圖像等模態)也一同發布。 至此,瑞為已累計牽頭及參與的國家/行業標準近30項,其中已發布實施的國家標準16項。 作為《信息技術 可
    的頭像 發表于 04-22 18:05 ?926次閱讀

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    正式提出“智能體化用戶體驗”方向,并啟動“天璣智能體體驗領航計劃”。更值得注意的是,其三大AI工具鏈的發布——天璣開發工具集、AI開發套件2.0,以及升級的天璣星速引擎與旗艦芯片天璣
    發表于 04-13 19:52

    摩爾線程GPU原生FP8計算助力AI訓練

    近日,摩爾線程正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架。通過深度融合FP8混合訓練策略和高性能算子庫,這兩大框架在國產全功能GPU上實現了高效的混合
    的頭像 發表于 03-17 17:05 ?1528次閱讀
    摩爾線程GPU原生<b class='flag-5'>FP8</b>計算助力<b class='flag-5'>AI</b>訓練