国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

奇異摩爾專用DSA加速解決方案重塑人工智能與高性能計算

奇異摩爾 ? 來源:奇異摩爾 ? 2024-09-19 11:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫在開頭,奇異摩爾的 NDSA 互聯系列產品基于高性能RoCEv2 RDMA引擎,是面向智算網絡通信加速及無損數據傳輸的專用DSA加速解決方案。

本文部分內容來源于麥肯錫白皮書

隨著摩爾定律下的晶體管縮放速度放緩,單純依靠增加晶體管密度的通用計算的邊際效益不斷遞減,促使專用計算日益多樣化,于是,針對特定計算任務的專用架構成為計算創新的焦點。

在過去的幾十年的時間里,半導體晶圓上的晶體管密度幾乎每兩年翻一番,這一趨勢令人矚目。但在過去幾年中,晶體管縮放的速度顯著放緩,比摩爾定律預測的速度落后了大約十倍。

2018年,著名計算機架構師約翰·亨尼斯西(John Hennessy)和大衛·帕特森(David Patterson)在圖靈講座中指出,半導體工藝創新的放緩將逐漸增加對架構創新的激勵——即集成電路的設計方式,以執行計算任務。

“他們認為,通用計算架構(如CPU)固有的低效性將開始被專門針對特定計算任務的架構(也稱為領域專用架構,DSAs)的計算能力和成本效益所取代 。”

與此同時,隨著計算和數字化在云計算(人工智能和高性能計算)、網絡、邊緣、物聯網(IoT)和自動駕駛等眾多應用領域中普及,高度領域專用的計算工作負載正在為DSAs提供有意義的性能優勢。大型語言模型(生成式AI的核心引擎),例如ChatGPT,在高容量的AI工作負載中提供了進一步的專業化,這促進了進一步的硬件專業化。 DSA(domain-specific architecture)為特定應用領域開發的硬件和軟件的商業潛力是巨大的。專用的圖形處理單元 (GPU) 和張量處理單元 (TPU) 已經在數據中心獲得了重要的市場份額,它們在 AI 工作負載學習和推理方面的表現優于 CPU。使用GPU和TPU對某些應用的性能提升是非常顯著的,特定工作負載的可以實現15 到 50 倍的加速。此外,在汽車領域,來自領先供應商的定制的專用于某些計算場景的DSA硬件也提供了安全支持日益提高的自動駕駛水平所需的低延遲、高性能推理。

wKgaombrnnKAGY13AAKCgBR1DvE660.png

隨著 DSA 擴展到其他應用領域,麥肯錫咨詢估計到 2026 年,DSA 將占約 900 億美元的收入(約占全球半導體市場的 10% 至 15%),高于 2022 年的約 400 億美元。因此,我們看到在這個方向的硬件類的風險投資顯著增加也就不足為奇了。

01 算力革命下的高性能網絡DSA

隨著人工智能及高性能計算的高速發展,服務器集群的瓶頸逐漸從單CPU、GPU、APU的算力轉換到硬件間的互聯能力。傳統的數據中心架構中包含CPU、內存、存儲和網絡等組件,但CPU目前已經公認不再是運行基礎設施功能的最佳位置了。對于下一代數據中心而言,面向網絡加速的DSA將扮演重要的角色,根據不同應用場景的需求,加速數據傳輸。同時,以太網速度從25G增加到100G、200G、400G,再到800G,甚至還有持續增長的趨勢,超大規模數據中心的硬件架構在逐漸轉變。

據估計,對于超大規模數據中心來說,大約有一半的CPU被用在了非創收型任務上。網絡DSA可以承擔大部分繁重的工作,將CPU解放出來,專注于創收的應用處理上。同時,由于功能和作用不同,北向網絡和高帶寬域在設計時側重點不同。北向網絡側重于網絡控制與管理,主要是網絡控制器與上層應用之間的接口通信。高帶寬域網絡側重于數據傳輸性能,旨在提供高速度、低延遲的網絡連接?;赗oCE的RDMA技術,兼容現有的以太網基礎設施,擁抱開放生態,是業界解決高帶寬域網絡與北向網絡數據傳輸的重要解決方案。

02 Chiplet設計方法與DSA的完美結合

結合Chiplet設計方法學與DSA的設計,可以構建出高效、靈活且高度定制化的計算平臺。Chiplet設計方法學通過將處理器設計拆分為多個獨立的Chiplet,每個Chiplet可以針對特定功能進行優化。這樣可以在設計、制造和測試中提高靈活性。同時,不同的Chiplet分工明確,可以專門處理不同的任務,例如CPU核心、內存控制器、I/O接口等。而DSA針對特定計算任務進行優化,例如生成式人工智能、圖形處理、網絡處理等,相比于通用處理器,DSA在其特定領域內具有更高的性能和能效比。

通過Chiplet方法學,可以將多個DSA集成到一個系統中,創建一個高度定制化的平臺。比如,一個系統可以包含CPU、GPU、TPU、DPU等Chiplet,根據應用需求靈活組合。在這一背景下,組件之間的高速可連接對于確保順利快速的數據傳輸至關重要。互聯標準、帶寬、延遲和低延遲是關鍵指標。

03奇異摩爾NDSA網絡加速與無損數據傳輸解決方案

在智算中心領域,奇異摩爾 的NDSA互聯系列產品復用以太網基礎設施,基于高性能RoCEv2 RDMA引擎,面向智算網絡通信加速及無損數據傳輸的專用DSA加速解決方案。

AI原生智能網卡

奇異摩爾的Kiwi NDSA-SNIC AI原生智能網卡針對網絡數據傳輸,基于RoCE V2 RDMA技術,自適應網絡調度算法,搭載可編程加速核心SDPU,高達800G傳輸帶寬,實現Tb級萬卡集群無損數據傳輸。

高性能網絡加速芯粒

奇異摩爾的高性能網絡加速芯粒 – Kiwi NDSA互聯芯粒針對高帶寬域數據傳輸,基于RoCEv2 RDMA技術,單芯粒傳輸帶寬高達800G,攜帶UCIe-D2D芯??蓴U展互聯接口,實現集群內TB級的高速通信。

寫在最后,無論是在高性能計算領域還是在人工智能領域,我們會預見更多加速數據傳輸的DSA問世。它們通過提供高吞吐量效率,計算節點之間的超快速互連,或提升人工智能訓練的效率,為半導體價值鏈的參與者及其客戶帶來更多的革新和挑戰。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54010

    瀏覽量

    466155
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265422
  • 奇異摩爾
    +關注

    關注

    0

    文章

    79

    瀏覽量

    4037

原文標題:Kiwi Talks | DSA專用領域芯片正在重塑人工智能與高性能計算

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自然智能與人工智能融合如何重塑芯片設計

    人類大腦是所有處理器中最復雜的,能夠構思出不可思議的創意,解決復雜、微妙的問題。相比之下,人工智能擅長快速分析海量數據并高效執行任務。當自然智能人工智能融合的結果,就是芯片設計領域正在經歷一場令人驚嘆的變革。
    的頭像 發表于 01-15 13:58 ?518次閱讀

    奇異摩爾參編人工智能加速器互聯芯粒技術要求團體標準發布

    近日,中國電子工業標準化技術協會批準并發布了《人工智能超節點服務器技術要求》等28項團體標準。其中由中國移動研究院牽頭、奇異摩爾產品市場&研發部門主要參編的《人工智能
    的頭像 發表于 01-09 11:20 ?590次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>參編<b class='flag-5'>人工智能</b><b class='flag-5'>加速</b>器互聯芯粒技術要求團體標準發布

    人工智能+消費:技術賦能與芯片驅動未來

    電子發燒友網站提供《人工智能+消費:技術賦能與芯片驅動未來.pptx》資料免費下載
    發表于 11-26 14:50 ?34次下載

    AMD攜全棧式AI解決方案亮相進博會,賦能人工智能+

    2025年11月5日,上海: 第八屆中國國際進口博覽會在上海正式啟幕。作為全球高性能與自適應計算領導者,AMD連續五年亮相進博會。今年,以“AMD賦能人工智能+”為主題,AMD全面展示貫穿云、端
    的頭像 發表于 11-06 12:53 ?282次閱讀
    AMD攜全棧式AI<b class='flag-5'>解決方案</b>亮相進博會,賦能<b class='flag-5'>人工智能</b>+

    MT8391(Genio 720)參數規格書 _AIoT高性能邊緣智能解決方案

    隨著物聯網技術的蓬勃發展和人工智能的廣泛應用,智能設備正逐步邁向更高效、更智能的階段。而聯發科MT8391(Genio 720)平臺正是為滿足這一趨勢而打造的高性能邊緣
    的頭像 發表于 10-20 20:17 ?668次閱讀
    MT8391(Genio 720)參數規格書 _AIoT<b class='flag-5'>高性能</b>邊緣<b class='flag-5'>智能解決方案</b>

    Vicor高性能電源模塊在數據中心的應用優勢

    隨著人工智能(AI)在高性能計算中發揮越來越重要的作用,為能耗巨大的AI服務器提供高效、高性能的電源解決方案,變得至關重要。
    的頭像 發表于 09-29 16:50 ?1625次閱讀

    傲琪人工合成石墨片: 破解智能手機散熱困境的創新解決方案

    的突破 傲琪人工合成石墨片針對這些需求提供了全面解決方案。該材料采用先進的高溫石墨化工藝制備,形成了高度取向的晶體結構,實現了卓越的面內導熱性能。 與傳統金屬材料相比,石墨片在相同厚度下提供更優的熱傳導
    發表于 09-13 14:06

    墨芯人工智能亮相2025外灘大會

    9月10日至13日,墨芯人工智能在2025外灘大會盛大亮相,成為"數據與計算展區"備受矚目的焦點之一。作為深耕稀疏計算的AI芯片企業,墨芯在此次展會上全方位展示了其人工智能芯片、
    的頭像 發表于 09-11 14:04 ?805次閱讀

    兆芯攜手合作伙伴在WAIC 2025展示人工智能計算與決策解決方案

    2025世界人工智能大會近日在上海盛大開幕。大會期間,兆芯攜手上交智算院、科算云共同呈現了基于自研CPU的人工智能計算與決策解決方案,展現了自主CPU技術與AI應用的融合創新,激發新質
    的頭像 發表于 08-04 10:12 ?979次閱讀

    RISC-V+DSA:躍昉科技袁博滸解析芯算格局重塑的技術路徑

    《RISC-V+DSA重塑芯算格局的必然選擇》的主題演講,深入探討了RISC-V架構與特定領域加速架構(DSA)結合的技術路徑及其在高性能
    的頭像 發表于 07-23 10:32 ?814次閱讀
    RISC-V+<b class='flag-5'>DSA</b>:躍昉科技袁博滸解析芯算格局<b class='flag-5'>重塑</b>的技術路徑

    Axelera AI:邊緣計算加速智能創新解決方案

    。AxeleraAI憑借其卓越的AI加速解決方案,致力于協助企業快速部署高性能、低功耗的邊緣計算平臺,廣泛應用于智慧城市、智慧交通及工業檢測等領域。接下來說明AxeleraAI產品特色
    的頭像 發表于 07-17 11:00 ?1094次閱讀
    Axelera AI:邊緣<b class='flag-5'>計算</b><b class='flag-5'>加速</b><b class='flag-5'>智能</b>創新<b class='flag-5'>解決方案</b>

    AI芯片:加速人工智能計算專用硬件引擎

    人工智能(AI)的快速發展離不開高性能計算硬件的支持,而傳統CPU由于架構限制,難以高效處理AI任務中的大規模并行計算需求。因此,專為AI優化的芯片應運而生,成為推動深度學習、
    的頭像 發表于 07-09 15:59 ?1587次閱讀

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發展的當下,無論是探索未來職業方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模
    發表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網,WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能人工智能
    發表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用

    -Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用 Cognizant將在關鍵增長領域提供解決方案,包括企業級AI
    的頭像 發表于 03-26 14:42 ?745次閱讀
    Cognizant將與NVIDIA合作部署神經<b class='flag-5'>人工智能</b>平臺,<b class='flag-5'>加速</b>企業<b class='flag-5'>人工智能</b>應用