国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

匹敵7nm GPU,燧原科技第二代云端AI推理卡發布,落地服務器、身份識別、車路協同等應用

21克888 ? 來源:電子發燒友網 ? 作者:黃晶晶 ? 2021-12-09 13:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數據算力需求的日益增長帶動了AI芯片行業的興起,作為中國AI芯片的中堅力量,燧原科技聚焦于AI訓練與推理不斷推出芯片以及加速卡產品。12月7日,燧原科技重磅發布第二代云端人工智能推理加速卡“云燧i20”,這是時隔僅五個月,繼今年7月發布云端人工智能訓練加速卡“云燧T20”之后,燧原科技又推出的全新一代針對云端推理場景的AI加速產品。

燧原科技CEO趙立東和COO張亞林發布第二代云端AI推理產品


燧原科技CEO趙立東在發布會上表示,我們的第1代訓練和推理產品已經在國家重點實驗室、互聯網、智慧城市、智慧金融等幾大方向上實現了突破,已產生了過億的訂單和收入。在這個過程中,我們也通過多種業務模式和產學研結合,建立了強大的朋友圈和生態圈。隨著第2代訓練和推理兩條產品線逐步量產,以及軟件生態的不斷優化和完善,業務的加速落地和規模化正按計劃逐步實現。未來,我們除了繼續大力拓展上述的幾個業務方向之外,還會在高性能計算,交通和能源等領域投入資源,拓展商機。


從2017年到2023年,整個AI云端市場訓練和推理產品比例在發生變化,推理產品比例在慢慢變高。基于這樣的AI市場趨勢,燧原科技COO張亞林表示,燧原科技也在做產品線拓展,AI的業務從傳統的單一的機器視覺、聲音、文字,還有決策、推薦等方向性的算法,已經變成多場景、多應用的落地,廣泛分布在用戶日常生活中。

12nm工藝打造的新一代“邃思”AI推理芯片


第二代云端推理加速卡云燧i20,基于新一代“邃思”AI推理芯片,它采用第二代高性能計算核心和數據引擎,由12nm工藝打造,通過架構升級,大大提高了單位面積的晶體管效率,從而實現了與目前業內7nm GPU相匹敵的計算能力。不僅如此,基于12nm成熟工藝帶來的成本優勢,使得云燧i20在相同性能表現下更具性價比優勢。并且供應鏈體系更加穩定成熟,客戶的業務需求可以得到及時滿足。

燧原科技發布全新一代“邃思”云端AI推理芯片


具體來看,邃思推理芯片的計算架構具備全AI的算力空間,其中單精度FP32達到了32 TFLOPS,以及單精度張量TF32,達到了128 TFLOPS,它同樣具備半精度BF16/FP16的算力,達到128 TFLOPS。最重要的在推理方面,提升整個整數精度INT8,達到256TOPS。也就是,從FP32到INT8,包含中間精度TF32、BF16、FP16五個精度構成了全AI算力空間,滿足各種各樣推理的客戶需求。

邃思推理芯片用16位算力做到32位的精度效果。如何做到的?它具備TF32張量單精度,擁有4倍于FP32的算力,但是在整個模型上擁有99%的精度一致性。于是,就可以用4倍的FP32算力達到99%FP32的算力精度,這也是中國第一顆TF32的推理芯片。

邃思推理芯片的數據架構,擁有完全自研的SVS (Sparse Value Segment ) 數據壓縮格式。它能夠進行獨立的分層壓縮和硬件自動循環解壓,使得所有的數據,特別是稀疏數據在傳輸過程之中,能夠節省帶寬和功耗。它支持硬件指令預取的操作,使得指令的預取、數據的傳輸和計算可以同時進行。進行并行的數據廣播,使得同樣的數據可以廣播到多個處理器上進行并行執行。同時,它具有很強的動態功耗控制,讓整個數據傳輸的動態功耗變得非常的有效。

在存儲方面,燧原科技依然采用了業內最領先的HBM2E,由2顆HBM2E構建,單芯片容量達到16GB,最大帶寬達到819GB/s,在整個封裝上,依然采用2.5D的高級封裝,整合了五顆芯片,它的整個封裝尺寸達到了55毫米乘以55毫米。大芯片加上兩顆HBM2E存儲的護航,構建了計算加存儲的互促,使得AI的推理在帶寬、存儲容量和算力上能夠進行極致的發揮。

云燧i20加速卡性能顯著提升


比上一代云燧i10相比,云燧i20在浮點32位、浮點16位、整點8位的算力,以及存儲帶寬,存儲類型等方面都有巨大提升。云燧i20單精度FP32峰值算力達到32 TFLOPS,單精度張量TF32峰值算力達到128 TFLOPS,整型INT8峰值算力達到256 TOPS。對比第一代推理產品,云燧i20將浮點算力提升到1.8倍,整型算力提升到3.6倍。

燧原科技發布第二代人工智能推理加速卡“云燧i20”




和業內主流的GPU的次旗艦相比,云燧i20的浮點16位的算力、INT8的算力,都是其2倍,內存帶寬是2.65倍。

基準測試部分,在業內的主流模型中以友商的GPU次旗艦為baseline,從圖像分類、識別到目標檢測到圖像分割到圖像超分等整個模型來看,云燧i20是友商的GPU次旗艦的2.5到3.7倍不等。



一個例子是,針對bert文本場景分析,每一個白色的框是一段文本,通過邃思推理芯片DTU和GPU的實時渲染和處理,分析出每一段文字的情感,這個情感用彩色框標注為各種情緒。運時顯示,DTU整個分析速度明顯加快,彩色的框出現的比率明顯增高,頻率也越來越快。同時,DTU的實時性能是GPU的2.5倍以上,而實時的延時DTU只有GPU的不到一半。

軟件生態升級,搭建訓推一體化


此次,在軟件支持層面,升級后的“馭算TopsRider”軟件棧,在性能、開發效率和模型覆蓋面上得到大幅提升。通過引入通用高層圖優化和大規模算子融合技術,充分釋放了大容量片內存儲和高帶寬存儲的利用率,將模型平均性能提升3.5倍,硬件算力利用率平均提升2倍;通過升級的編程模型以及算子自動分片、自動生成技術,自定義算子開發效率翻倍,模型遷移成本大大降低;此外,馭算增強了對動態性的支持,使云燧i20在檢測、語音識別、語義理解等場景更具競爭力。

張亞林表示,T20和i20組合的訓推一體化系統日臻完善,在TopsRider軟件系統里,從高層的圖優化到中間的算子庫再到中間的編程模型,最后到底層的Runtime,四個階段中分別統一了整個訓練和推理引擎,使得用一套結構可以支持所有訓練和推理軟件棧,通過統一的表達,統一的訓練推理的算子編程模型和Runtime,訓練和推理棧進行了深度融合和充分泛化,在運用訓推一體化時更高效、精密和兼容。

同時,我們支持Lazy、Graph、Eager、Trace mode四種圖執行模式,這四種模式涵蓋了廣泛的框架和圖執行,它能適配各種各樣的訓練和推理的場景。通過今天i20和i20相關匹配的DTU2.5和TopsRider2.5的發布,燧原科技已經擁有第二代全系統、全自主的技術棧。

云燧i20已量產應用


目前,已經有不少合作伙伴推出了基于燧原科技i20板卡的服務器產品,包括浪潮、華三和超威等等,產品涵蓋4U到2U的服務器,搭配16張DTU的卡到2到4張DTU的卡,

比如,浪潮標準的4U服務器配置了16張i20板卡,以及2CPU,通過16張i20板卡,4U服務器能夠提供非常高的算力密度。



浪潮信息副總裁劉軍表示:“燧原科技是國產人工智能計算芯片的領軍企業,浪潮信息與燧原科技通過元腦生態聯合創新,在AI整機系統、AI算力優化、場景方案落地等多方面深入合作。此次云燧i20的發布,標志著燧原從訓練到推理全面進入2.0時代,這也是國產AI算力發展的里程碑。我們期待和燧原一起緊密合作,共同推進中國人工智能產業的快速發展。”

此外,在身份證識別、人像卡通化、人體姿態檢測、車路協同等應用場景,燧原云燧推理卡和相關識別技術的搭配,實現快速、精準的智能效果。





燧原科技以其國產AI算力產品為核心,以商業生態和科研生態為支撐,實現燧原科技的云端AI推理產品在互聯網、金融、政務等多家客戶的商業落地,并獲得認可。在第一代訓練和推理產品產生了過億的訂單和收入之后,相信第二代產品將加速向更多領域進行滲透。根據規劃,面向訓練和推理的下一代產品T30/T31,i30已經在研發中,三年完成兩代產品迭代,隨著燧原科技產品和技術路線圖延伸,將有更多驚喜的產品和技術的展露。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 推理
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7421
  • AI芯片
    +關注

    關注

    17

    文章

    2126

    瀏覽量

    36771
  • 燧原科技
    +關注

    關注

    0

    文章

    152

    瀏覽量

    10414
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    新品 | CoolSiC? MOSFET 650V第二代產品,新增75m?型號

    新品CoolSiCMOSFET650V第二代產品,新增75m?型號CoolSiCMOSFET650V第二代器件基于性能卓越的第一溝槽SiCMOSFET技術打造,通過提升性能、增強設計靈活性及魯棒性
    的頭像 發表于 01-12 17:03 ?308次閱讀
    新品 | CoolSiC? MOSFET 650V<b class='flag-5'>第二代</b>產品,新增75m?型號

    新品 | CoolSiC? MOSFET 400V與440V第二代器件

    新品CoolSiCMOSFET400V與440V第二代器件CoolSiCMOSFET400V與440V第二代器件兼具高魯棒性、超低開關損耗與低通態電阻等優勢,同時有助于優化系統成本。該系列400V
    的頭像 發表于 12-31 09:05 ?599次閱讀
    新品 | CoolSiC? MOSFET 400V與440V<b class='flag-5'>第二代</b>器件

    TeledyneLeCroy發布第二代DisplayPort 2.1 PHY合規測試與調試解決方案

    TeledyneLeCoy(Teledyne子公司)宣布第二代QualiPHY 2自動化合規測試框架現已支持DisplayPort 2.1物理層(PHY)合規性測試。
    的頭像 發表于 12-26 11:04 ?1574次閱讀

    新品 | 采用.XT擴散焊和第二代1200V SiC MOSFET的Easy C系列

    EasyPACK1C1200V13mΩ四單元模塊,搭載第二代CoolSiCMOSFET技術,集成NTC溫度傳感,采用大電流PressFIT引腳,并預涂2.0導熱界面材料。產品型號:■F4
    的頭像 發表于 11-24 17:05 ?1459次閱讀
    新品 | 采用.XT擴散焊和<b class='flag-5'>第二代</b>1200V SiC MOSFET的Easy C系列

    南芯科技發布第二代規級高邊開關SC77450CQ

    今日,南芯科技(證券代碼:688484)正式發布第二代規級高邊開關 (HSD) SC77450CQ,基于國內自主研發的垂直溝道 BCD 集成工藝和全國產化封測供應鏈,在 N 型襯底單晶圓上實現了
    的頭像 發表于 08-05 15:17 ?1381次閱讀
    南芯科技<b class='flag-5'>發布</b><b class='flag-5'>第二代</b><b class='flag-5'>車</b>規級高邊開關SC77450CQ

    新品 | 第二代CoolSiC? MOSFET G2 750V - 工業級與規級碳化硅功率器件

    新品第二代CoolSiCMOSFETG2750V-工業級與規級碳化硅功率器件第二代750VCoolSiCMOSFET憑借成熟的柵極氧化層技術,在抗寄生導通方面展現出業界領先的可靠性。該器件在圖騰柱
    的頭像 發表于 07-28 17:06 ?976次閱讀
    新品 | <b class='flag-5'>第二代</b>CoolSiC? MOSFET G2 750V - 工業級與<b class='flag-5'>車</b>規級碳化硅功率器件

    埃斯頓酷卓發布第二代人形機器人CODROID 02

    近日,埃斯頓酷卓科技正式發布第二代人形機器人CODROID 02。CODROID 02實現全身關節運動能力升級,顯著提升復雜場景適應性與靈活性,標志著國產人形機器人技術邁入新階段。
    的頭像 發表于 06-16 16:06 ?1772次閱讀

    AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統實現單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產品是對 Versal 產品組合的擴展,可為嵌入式系統實現單芯片智能。
    的頭像 發表于 06-11 09:59 ?1858次閱讀

    CPU性能提升4倍,加入后量子密碼學,解讀第二代OrangeBox連接域控制

    )以及車內各系統之間的數據交互與協同。 ? 為應對不斷提升的信息傳輸需求,以及量子計算對車載網絡安全造成的沖擊,恩智浦半導體宣布推出第二代 OrangeBox 規級開發平臺 OrangeBox 2.0,以促進汽車網關與無線技術
    的頭像 發表于 06-03 06:56 ?6460次閱讀

    恩智浦推出第二代OrangeBox規級開發平臺

    第二代OrangeBox開發平臺集成AI功能、后量子加密技術及內置軟件定義網絡的能力,應對快速演變的信息安全威脅。
    的頭像 發表于 05-27 14:25 ?1381次閱讀

    第二代AMD Versal Premium系列SoC滿足各種CXL應用需求

    第二代 AMD Versal Premium 系列自適應 SoC 是一款多功能且可配置的平臺,提供全面的 CXL 3.1 子系統。該系列自適應 SoC 旨在滿足從簡單到復雜的各種 CXL 應用需求
    的頭像 發表于 04-24 14:52 ?1255次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Premium系列SoC滿足各種CXL應用需求

    方正微電子推出第二代規主驅SiC MOS產品

    2025年4月16日,在上海舉行的三電關鍵技術高峰論壇上,方正微電子副總裁彭建華先生正式發布第二代規主驅SiC MOS 1200V 13mΩ產品,性能達到國際頭部領先水平。
    的頭像 發表于 04-17 17:06 ?1522次閱讀

    推理服務器7大可靠性指標,寬溫/抗震/EMC防護實測數據分享

    在 AIoT 設備突破百億級的今天,邊緣計算推理服務器已成為智能時代的 "神經末梢"。根據 Gartner 預測,到 2025 年將有 75% 的企業關鍵任務部署在邊緣端。然而,工業級應用場景(如智能工廠、無人礦山、
    的頭像 發表于 04-02 10:43 ?1143次閱讀
    <b class='flag-5'>推理</b><b class='flag-5'>服務器</b>的<b class='flag-5'>7</b>大可靠性指標,寬溫/抗震/EMC防護實測數據分享

    Framework召開第二代產品發布會,新品搶先看!

    2025年2月25日,Framework在美國舊金山召開了盛大的第二代產品發布會。Framework發布了有史以來最大規模的一系列新品,包括Framework臺式機
    的頭像 發表于 03-19 17:55 ?1497次閱讀
    Framework召開<b class='flag-5'>第二代</b>產品<b class='flag-5'>發布</b>會,新品搶先看!

    比亞迪二代刀片電池或3月17日發布

    之后,又打出的一把大牌。 據悉,比亞迪第二代刀片電池的能量密度提升很大;達到35%,由一刀片電池的整包140Wh/kg能量密度,提升至整包190Wh/kg。這意味著續航700公里的,搭載
    的頭像 發表于 03-13 18:16 ?3075次閱讀