国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

<optgroup id="8tndv"></optgroup>

^{<tbody id="8tndv"></tbody>}

<listing id="8tndv"><b id="8tndv"></b></listing>

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

國產高性能GPGPU的破局點在哪

電子發燒友網報道（文/吳子鵬）GPU誕生的原因是人們需要更好地處理3D游戲中的圖形渲染，因此GPU擁有很多很小的內核增加并行處理能力，然后通過圖形流水線的模式做圖形處理。由于天生核心數量多，因此GPU計算能力增加迅速，業界普遍認為2004年前后GPU計算能力已經超過CPU，此后兩者之間的算力差距越拉越大。

擁有強大算力之后，更多的應用開始找上GPU，比如氣候檢測，還有時下大熱的深度學習等。快速增長的計算需求也開始改變GPU，早期用于通用計算的GPU實際上還是遵循圖形處理的原則來設計，內部依然有Vertex級處理器以及Fragment級處理器，面向其他運算需求顯得“不倫不類”，直到英偉達設計出了統一處理器。

此后，GPGPU在任務清晰且計算量要求大的領域，比如矩陣的計算上優勢愈發凸顯。受益于人工智能、大數據和萬物互聯等多層buff加持，越來越多的行業開始提出這樣的計算需求，GPGPU前景光明且市場巨大。在這樣的背景下，目前國內已經涌現出一批GPGPU企業，沐曦集成電路（上海）有限公司（以下簡稱：沐曦）便是其中之一，該公司致力于提供高性能GPU。

軟件棧決定了用戶群大小和用戶體驗

回顧GPGPU的發展，我們發現市場需求不僅是改變了GPGPU的核心布局，同時為了兼顧通用性，軟件端也發展了巨大的改變，從OpenGL演化出統一計算架構CUDA。沐曦光啟智能研究院科學家李兆石在接受電子發燒友采訪時表示，“GPGPU作為一款通用芯片，在面對不同客戶層出不窮的新需求時，需要保證它的可編程性。可編程性是由完善的軟件棧來保證的。

對于所有GPGPU來說，軟件棧的規劃直接決定了GPGPU用戶受眾群體大小和用戶使用體驗。因此所有的GPGPU，不論是否國產，都會擁有自己的運算平臺，即軟件棧。比如AMD面向它的MI系列GPGPU，對標CUDA，開發了RoCM，并在RoCM之上移植了PyTorch等AI軟件框架。”

他強調GPGPU上軟件棧是至關重要的，對此他通過分析英偉達的CUDA來解釋原因。“GPGPU芯片非常龐大，最新的Nvidia A100上有542億個晶體管，它們構成了6912個并發執行的CUDA內核，以及為了保證CUDA內核的數據供給而設計的一套復雜的存儲子系統。

考慮到人的思維方式是串行的，用戶很難處理這么多的并發執行單元，因此這么多并發的硬件資源不可能直接暴露給用戶。所以我們需要有一套軟件棧將底層硬件架構的特征抽象成易于理解的編程模型提供給用戶，從而讓用戶充分開發GPGPU的潛力。”

李兆石講到，“然而抽象是有代價的：抽象掩藏掉的硬件細節越多，編程模型對用戶越友好，那么它會越難充分發揮硬件的全部潛力。因此GPGPU的抽象是分層次的：越靠近用戶的層次越易用，同時該層次的性能或者靈活性會越差。這樣特定應用領域的用戶，如果重心在開發效率，可以選擇高層次的編程模型；而需要榨取GPGPU性能潛力的用戶可以選擇低層次的編程模型。這也正是我們把GPGPU的編程模型稱為‘軟件棧’的原因。”

目前，國產GPGPU顯然還是跟隨者的狀態，雖然廠商在積極地推進架構創新和軟件創新，但和英偉達之間的差距還是巨大的，因此從英偉達身上國產GPU還有很多經驗可以汲取。李兆石對英偉達在GPGPU上面的軟件實力有著清晰的認識。

他指出：“英偉達的AI軟件棧自底向上至少可以分成5層：SASS是硬件實際執行的指令集，類似CPU的匯編；PTX是虛擬指令集，為不同代的Nvidia GPGPU提供了一個統一的編程接口；CUDA是用戶在編寫高性能GPGPU程序時最主要的編程模型；

cuBLAS， cuDNN， cuFFT， CUTLASS等運算庫則讓用戶可以通過調用Nvidia針對自家GPGPU高度定制的算子庫，不需要花費太多精力進行性能調優就可以享受到Nvidia GPGPU最好的性能，但它們靈活性受限；TensorRT， Triton， Megastron則是Nvidia針對特定AI應用場景深度定制，讓AI類用戶開箱即用的軟件平臺。”

可以看出，CUDA處于中間層。CUDA提供了硬件的直接訪問接口，而不必像傳統方式一樣必須依賴圖形API接口來實現GPU的訪問。CUDA采用C語言作為編程語言提供大量的高性能計算指令開發能力，使開發者能夠在GPU的強大計算能力的基礎上建立起一種效率更高的密集數據計算解決方案。

李兆石認為：“對于新興的國產GPGPU而言，構建自己的軟件棧時，首要任務是先打好基礎，對標CUDA及以下的抽象層次，充分發揮自己芯片的特色，開發出一套用戶可用、易用的編程模型，正所謂‘不積硅步無以至千里’。然后再結合目標客戶的需求，對標TensorRT等框架，定制開箱即用的高層次編程模型。”

在此，他談到了沐曦的規劃。當前，沐曦GPGPU的芯片架構和軟件棧是同時開發的。芯片架構上與現有GPGPU擁有不同的新特性，在設計之初都充分考慮了如何在各個層次的編程模型中進行抽象。這樣，沐曦可以保證用戶即可以平滑地從現有GPGPU遷移到沐曦的GPGPU上，又能在使用沐曦的軟件棧時充分享受到新特性帶來的更好體驗。

著眼于未來的發展，英偉達CUDA既是國產GPGPU在并行計算架構方面的老師，也是最大的勁敵。目前，CUDA已經能夠支持DX12這樣的API，也支持C語言、Fortran、OpenCL等計算語言，其生態屬性非常強大。

并且根據英偉達官方的說法，CUDA未來的發展是開放性的技術平臺，支持更多的并行計算需求。這樣的CUDA會給國產GPGPU在軟件棧方面的發展造成巨大的困擾，因此李兆石呼吁：“國內各家GPGPU創業公司都有自研IP和軟件棧的規劃。從公開的信息來看，各家公司的軟件棧規劃都存在一定的共性。希望未來大家可以多多相互交流，共同進步。”

傳統GPU的軟件棧很難遷移到GPGPU上

GPGPU在GPU的基礎上進行了優化設計，使之更適合高性能并行計算，并能使用更高級別的編程語言，在性能、易用性和通用性上更加強大。相較而言，國產GPU的啟動比國產GPGPU要提前一些，是否有經驗可循呢？

李兆石認為：“傳統GPU主要面向圖形渲染類應用。對于Nvidia來說，圖形渲染類應用的軟件棧與GPGPU的軟件棧，只有底層的SASS， PTX和少量CUDA是共享的。再往上走的圖形渲染API層，如OpenGL， Vulkan等，目前GPGPU還不需要支持。

國產傳統的圖形渲染GPU，大多基于自研的匯編層，對提供圖形渲染API層提供支持。我們的底層設計（與Nvidia SASS和PTX同層次的匯編）與Nvidia及其它國產GPU是不同的，因此傳統的圖形渲染GPU軟件棧難以直接遷移到GPGPU上。”

應用領域方面，GPGPU將應用擴展到了圖形之外，在科學計算、區塊鏈、大數據處理、工程計算、金融、基因等方面都有重要的應用，但更多是以服務器的形態提供高算力。

在應用層面，目前傳統GPU和CPU的融合趨勢已經顯現，比如AMD APU系列，蘋果的M1芯片、以及大多數手機SoC芯片等，它們的CPU和GPU都是直接在物理上共享內存。這些芯片通過CPU和GPU的緊密耦合，避免了CPU和GPU之間數據跨芯片搬運的能量消耗。

李兆石表示：“對于GPGPU而言，目前市面上還沒有成熟的產品，讓CPU和GPGPU在同一個die上緊密耦合。造成這一現象的原因有兩個。首先，CPU和GPGPU之間的通信延遲或帶寬，在目前流行的GPGPU應用中不是系統的瓶頸。

GPGPU的編程模型中，CPU與GPGPU間的通信用于處理應用中的控制邏輯。而GPGPU通常用來處理計算密集型應用或者訪存密集型應用，其瓶頸在于GPGPU上的計算資源、或者GPGPU與顯存（GDDR或者HBM）之間的通信帶寬。

控制密集型應用很少大規模部署在GPGPU上。其次，GPGPU通常以加速卡的形式部署在服務器上，服務器廠商出于成本、可靠性和可擴展性的考慮，會分別采購CPU和GPGPU。”

“不過，對于CPU和GPGPU的融合，我們還是要以發展的眼光看問題。從應用需求的角度，隨著張量加速單元和HBM技術在GPGPU的普及，GPGPU的計算和訪存能力快速提升。正所謂‘按下葫蘆浮起瓢’，此時CPU和GPGPU的通信代價正在變得越來越顯著。

尤其當我們考慮到新興的Pytorch等AI框架的動態圖特性會引入非常頻繁的CPU-GPGPU之間的交互時，低延遲的CPU-GPGPU緊耦合架構就變得更有價值了。從系統設計的角度，新興的Chiplet技術可以有效降低封裝內CPU和GPGPU緊耦合的設計成本。所以我們也很期待新的應用需求和封裝技術可以使能未來的融合CPU-GPGPU芯片。” 李兆石在采訪中講到。

聲明：本文由電子發燒友原創，轉載請注明以上來源。如需入群交流，請添加微信elecfans999，投稿爆料采訪需求，請發郵箱huangjingjing@elecfans.com。

編輯：jq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

芯片

芯片

+關注

關注
463

文章
54024

瀏覽量
466393
3D

3D

+關注

關注
9

文章
3012

瀏覽量
115099
cpu

cpu

+關注

關注
68

文章
11282

瀏覽量
225122
gpu

gpu

+關注

關注
28

文章
5197

瀏覽量
135521

原文標題：國產高性能GPGPU的破局點是什么？

文章出處：【微信號：elecfans，微信公眾號：電子發燒友網】歡迎添加關注！文章轉載請注明出處。

評論

精選推薦
更多

文章

資料

帖子

基于FPGA的低照度條件下EBAPS圖像混合噪聲去除算法

FPGA設計論壇
41分鐘前

106 閱讀

恒溫晶振技術參數指標怎么看？

賽思電子
20小時前

1066 閱讀

AI需求爆發，高端MLCC轉賣方市場，國產廠商如何接招抓住風口

海闊天空的專欄
20小時前

1494 閱讀

納芯微智能隔離柵極驅動NSI67x0助力電驅小型化與高可靠設計

米芯微電子
20小時前

1077 閱讀

企業級AI Agent王炸! 英偉達GTC將開源 NemoClaw

章鷹觀察
22小時前

1914 閱讀

matlab實驗講義下載

jsqueh
33333

10積分

218下載

基于LT3090_Typical Application直流到直流單輸出電源的參考設計

王蘭
687.36KB

3積分

11下載

FFmpegCommand適用于Android的FFmpeg命令庫

斗地主之神
24.23 MB

2積分

1下載

ouzel C++游戲引擎

劉勇
24.54 MB

2積分

1下載

Ultra96 SDR第一部分：簡單的射頻頻譜圖Web應用程序

王磊
3.16 MB

2積分

6下載

5V_ext為輸入，5V_MEAS為輸出，請問電路原理是什么，作用是什么？

jf_52890932
10小時前

52 閱讀

【瑞薩AI挑戰賽-FPB-RA6E2】+ 從零開始：FPB-RA6E2 開箱測評與 e2 studio 環境配置

時光找茬
1天前

61 閱讀

【米爾全志T153開發板評測】LVGL 9.3.0 移植到 MYD-YT153MX-MINI 開發板

華仔stm32
1天前

37 閱讀

在昉·星光開發板上通舵機控制板實現機器人舵機控制

感謝相遇
2天前

514 閱讀

使用 VisionFive 2 上的氣壓傳感器測量高度

大連云港
2天前

534 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视