国产精品欧美久久久,国产激情乱伦,国产精品99久久

寫在開頭，奇異摩爾的 NDSA 互聯系列產品基于高性能RoCEv2 RDMA引擎，是面向智算網絡通信加速及無損數據傳輸的專用DSA加速解決方案。

本文部分內容來源于麥肯錫白皮書

隨著摩爾定律下的晶體管縮放速度放緩，單純依靠增加晶體管密度的通用計算的邊際效益不斷遞減，促使專用計算日益多樣化，于是，針對特定計算任務的專用架構成為計算創新的焦點。

在過去的幾十年的時間里，半導體晶圓上的晶體管密度幾乎每兩年翻一番，這一趨勢令人矚目。但在過去幾年中，晶體管縮放的速度顯著放緩，比摩爾定律預測的速度落后了大約十倍。

2018年，著名計算機架構師約翰·亨尼斯西(John Hennessy)和大衛·帕特森(David Patte rson)在圖靈講座中指出，半導體工藝創新的放緩將逐漸增加對架構創新的激勵——即集成電路的設計方式，以執行計算任務。

“他們認為，通用計算架構(如CPU)固有的低效性將開始被專門針對特定計算任務的架構(也稱為領域專用架構，DSAs)的計算能力和成本效益所取代。”

與此同時，隨著計算和數字化在云計算(人工智能和高性能計算)、網絡、邊緣、物聯網(IoT)和自動駕駛等眾多應用領域中普及，高度領域專用的計算工作負載正在為DSAs提供有意義的性能優勢。大型語言模型(生成式AI的核心引擎)，例如ChatGPT，在高容量的AI工作負載中提供了進一步的專業化，這促進了進一步的硬件專業化。 DSA(domain-specific architecture)為特定應用領域開發的硬件和軟件的商業潛力是巨大的。專用的圖形處理單元 (GPU) 和張量處理單元 (TPU) 已經在數據中心獲得了重要的市場份額，它們在 AI 工作負載學習和推理方面的表現優于 CPU。使用GPU和TPU對某些應用的性能提升是非常顯著的，特定工作負載的可以實現15 到 50 倍的加速。此外，在汽車領域，來自領先供應商的定制的專用于某些計算場景的DSA硬件也提供了安全支持日益提高的自動駕駛水平所需的低延遲、高性能推理。

隨著 DSA 擴展到其他應用領域，麥肯錫咨詢估計到 2026 年，DSA 將占約 900 億美元的收入(約占全球半導體市場的 10% 至 15%)，高于 2022 年的約 400 億美元。因此，我們看到在這個方向的硬件類的風險投資顯著增加也就不足為奇了。

01 算力革命下的高性能網絡DSA

隨著人工智能及高性能計算的高速發展，服務器集群的瓶頸逐漸從單CPU、GPU、APU的算力轉換到硬件間的互聯能力。傳統的數據中心架構中包含CPU、內存、存儲和網絡等組件，但CPU目前已經公認不再是運行基礎設施功能的最佳位置了。對于下一代數據中心而言，面向網絡加速的DSA將扮演重要的角色，根據不同應用場景的需求，加速數據傳輸。同時，以太網速度從25G增加到100G、200G、400G，再到800G，甚至還有持續增長的趨勢，超大規模數據中心的硬件架構在逐漸轉變。

據估計，對于超大規模數據中心來說，大約有一半的CPU被用在了非創收型任務上。網絡DSA可以承擔大部分繁重的工作，將CPU解放出來，專注于創收的應用處理上。同時，由于功能和作用不同，北向網絡和高帶寬域在設計時側重點不同。北向網絡側重于網絡控制與管理，主要是網絡控制器與上層應用之間的接口和通信。高帶寬域網絡側重于數據傳輸性能，旨在提供高速度、低延遲的網絡連接?；赗oCE的RDMA技術，兼容現有的以太網基礎設施，擁抱開放生態，是業界解決高帶寬域網絡與北向網絡數據傳輸的重要解決方案。

02 Chiplet設計方法與DSA的完美結合

結合Chiplet設計方法學與DSA的設計，可以構建出高效、靈活且高度定制化的計算平臺。Chiplet設計方法學通過將處理器設計拆分為多個獨立的Chiplet，每個Chiplet可以針對特定功能進行優化。這樣可以在設計、制造和測試中提高靈活性。同時，不同的Chiplet分工明確，可以專門處理不同的任務，例如CPU核心、內存控制器、I/O接口等。而DSA針對特定計算任務進行優化，例如生成式人工智能、圖形處理、網絡處理等，相比于通用處理器，DSA在其特定領域內具有更高的性能和能效比。

通過Chiplet方法學，可以將多個DSA集成到一個系統中，創建一個高度定制化的平臺。比如，一個系統可以包含CPU、GPU、TPU、DPU等Chiplet，根據應用需求靈活組合。在這一背景下，組件之間的高速可連接對于確保順利快速的數據傳輸至關重要。互聯標準、帶寬、延遲和低延遲是關鍵指標。

03奇異摩爾NDSA網絡加速與無損數據傳輸解決方案

在智算中心領域，奇異摩爾的NDSA互聯系列產品復用以太網基礎設施，基于高性能RoCEv2 RDMA引擎，面向智算網絡通信加速及無損數據傳輸的專用DSA加速解決方案。

AI原生智能網卡

奇異摩爾的Kiwi NDSA-SNIC AI原生智能網卡針對網絡數據傳輸，基于RoCE V2 RDMA技術，自適應網絡調度算法，搭載可編程加速核心SDPU，高達800G傳輸帶寬，實現Tb級萬卡集群無損數據傳輸。

高性能網絡加速芯粒

奇異摩爾的高性能網絡加速芯粒 – Kiwi NDSA互聯芯粒針對高帶寬域數據傳輸，基于RoCEv2 RDMA技術，單芯粒傳輸帶寬高達800G，攜帶UCIe-D2D芯?？蓴U展互聯接口，實現集群內TB級的高速通信。

寫在最后，無論是在高性能計算領域還是在人工智能領域，我們會預見更多加速數據傳輸的DSA問世。它們通過提供高吞吐量效率，計算節點之間的超快速互連，或提升人工智能訓練的效率，為半導體價值鏈的參與者及其客戶帶來更多的革新和挑戰。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

芯片

芯片

+關注

關注
463

文章
54010

瀏覽量
466155
人工智能

人工智能

+關注

關注
1817

文章
50098

瀏覽量
265422
奇異摩爾

奇異摩爾

+關注

關注
0

文章
79

瀏覽量
4037

原文標題：Kiwi Talks | DSA專用領域芯片正在重塑人工智能與高性能計算

文章出處：【微信號：奇異摩爾，微信公眾號：奇異摩爾】歡迎添加關注！文章轉載請注明出處。

搜索歷史

奇異摩爾專用DSA加速解決方案重塑人工智能與高性能計算

評論