国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

軟件生態(tài)上超越CUDA,究竟有多難?

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚 ? 2024-06-20 00:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)近日,英偉達憑借持續(xù)上漲的股價,正式超過了微軟成為全球市值最高的公司,這固然離不開GPU這一AI硬件的火熱,但之所以能一舉做到世界第一,也離不開軟件的加持,真正將其推向神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。

英偉達——CUDA的絕對統(tǒng)治

相信對GPU有過一定了解的都知道,英偉達的最大護城河就是CUDA。CUDA在后端架構(gòu)上處于絕對的統(tǒng)治地位,隨著AI發(fā)展越快,英偉達GPU+CUDA的開發(fā)生態(tài)發(fā)展愈發(fā)壯大,甚至到了很多競爭對手望其項背的水平。CUDA自2006年推出以來,即便在AI和深度學習沒有成為主流的時期,也在不斷發(fā)展并行計算,為開發(fā)者提供豐富的庫、工具和算法

時至今日,CUDA已經(jīng)為全球開發(fā)者打造了一個龐大的社區(qū),幾乎所有的深度學習框架,包括TensorFlow、Pytorch等都對CUDA做了優(yōu)化。為了盡快切入市場,絕大多數(shù)開發(fā)者都更傾向于選擇CUDA作為首要計算平臺。

與此同時,英偉達也在圍繞著CUDA在硬件架構(gòu)上做更深入的創(chuàng)新和升級,借助更先進的工藝和封裝技術(shù)提升計算性能和效率。比如隨著Volta架構(gòu)中引入Tensor核心后,英偉達GPU的矩陣運算得到大幅加強,深度學習訓練和推理的性能實現(xiàn)飛躍。兩者結(jié)合之下,使得CUDA坐穩(wěn)了第一的寶座。

在游戲軟件領(lǐng)域,英偉達的DLSS可以說是市面上最先進的專有超分技術(shù),且得益于持續(xù)的訓練,每一次版本升級都能帶來圖形渲染領(lǐng)域的突破。

最后是生產(chǎn)力工具相關(guān)的軟件生態(tài)上,英偉達在這塊的優(yōu)勢就更加足了,過去蘋果與AMD還在GPU上合作之際,不少生產(chǎn)力工具還是針對AMD的GPU做了不少硬件優(yōu)化的。然而隨著蘋果走向Arm架構(gòu),英偉達慢慢在這個市場壯大起來。

無論是Adobe旗下的多媒體處理軟件,還是一些獨立開發(fā)商打造的軟件,很多都有英偉達CUDA硬件加速的支持,甚至連英特爾的核顯在一些軟件支持上,都要好于AMD。正因如此,除了一些特效制作相關(guān)的工作外,工作站里的AMD GPU越來越少。

盡管谷歌、英特爾和高通等科技巨頭也在尋找打破CUDA壟斷地位的契機,但對于軟件生態(tài)而言,合作并不一定意味著共贏,最后很可能只是為市場提供更多的可選擇項,但在易用性、性能等方面,仍不如沒有駐足一路狂奔的CUDA。

AMD

AMD對于其GPU軟件生態(tài)則持以較為開放的態(tài)度,且極其重視開源開發(fā)社區(qū)。AMD的ROCm對標的正是英偉達的CUDA,但其并沒有對硬件做出限制,除了Radeon、Instinct系列的GPU外,也在擴展至其他硬件廠商的設(shè)備。這也得益于AMD沒有在硬件內(nèi)引入Tensor核心這樣的專有硬件,但也正是因為如此,導致其ROCm在某些任務(wù)上略顯遜色。

ROCm作為開源平臺,也提供多種庫和框架支持,也有一整套的開源工具鏈。正因如此,在HPC和云計算等領(lǐng)域,廠商其實更寧愿使用AMD的GPU,而不必要忍受英偉達的專用軟件棧。但苦于英偉達先行的軟件生態(tài),他們不得不首選英偉達的GPU。

AMD即便有了ROCm,整體軟件生態(tài)的成熟度依然不敵英偉達,對于HPC中部分不以商業(yè)成功為目標的項目而言,AMD已經(jīng)斬獲了不少份額,比如TOP500中前十的幾臺超算。但以整個TOP500榜單來看,英偉達依然占據(jù)主導地位。然而對于云供應(yīng)商來說,短時間內(nèi)依然沒法擺脫英偉達的統(tǒng)治,因為租用這些云服務(wù)的客戶們,更愿意在英偉達的CUDA平臺上開發(fā)。

在驅(qū)動軟件上,尤其是針對Linux的顯卡驅(qū)動,AMD采取了開源和閉源兩條路線,持續(xù)更新閉源驅(qū)動的同時,也允許開源社區(qū)定制化開源驅(qū)動。以基于Linux系統(tǒng)中AMD Radeon顯卡打造的Vulkan驅(qū)動AMDVLK為例,就支持了光線追蹤。然而,盡管開源驅(qū)動由于手動配置和社區(qū)貢獻的原因,兼容性要更高一些,但如果追求的是更高的性能,那么閉源驅(qū)動還是更具優(yōu)勢。

摩爾線程

國產(chǎn)GPU主要分為兩個方向,分別是支持圖形渲染的和不支持圖形渲染的,后者仍然想在AI領(lǐng)域內(nèi)突破,前者在推進C端產(chǎn)品的同時,也在布局B端的一系列AI GPU產(chǎn)品。在國產(chǎn)GPU產(chǎn)品中,在軟件生態(tài)上做得比較好的當屬摩爾線程了,他們在AI和圖形渲染上的軟件支持都有喜人的進展。

基于MUSA這一統(tǒng)一架構(gòu),摩爾線程打造了MTT S80這樣的桌面顯卡,以及面面向服務(wù)器應(yīng)用的MTT S3000等。與之配套的,是摩爾線程打造的軟件開發(fā)平臺,包括AI開發(fā)平臺、MUSA SDK、MT Smart Media和MTVerse XR等。

而且摩爾線程打造的這套生態(tài)架構(gòu)中,可以充分兼容現(xiàn)有軟件生態(tài),借助MUSIFY工具實現(xiàn)代碼零成本遷移到MUSA平臺。與AMD的ROCm一樣,MUSA做的也是兼容CUDA的路線,而不是像ZLUDA一樣重新編譯二進制代碼,所以并不違反英偉達的EULA條款。

從摩爾線程近來官方發(fā)布的消息看來,他們在AI上選擇了逐步對大模型完成適配支持的路線。在摩爾線程的夸娥千卡智算集群上,他們已經(jīng)完成了30億到700億參數(shù)的大模型訓練和推理適配。摩爾線程的GPU在算力上對比國際大廠還是略有遜色,不過隨著未來他們在IP、硬件設(shè)計上進一步突破,相信他們也能打造出高性能的AI算力底座。

在針對消費級圖形顯卡的驅(qū)動程序上,摩爾線程也在不斷更新優(yōu)化性能。以5月底發(fā)布的v260.70版本驅(qū)動為例,除了提供對OpenGL 4.0功能的支持和優(yōu)化Blender 3.6 LTS體驗外,也為諸多熱門游戲在DirectX 11下的性能做了明顯優(yōu)化。盡管這類驅(qū)動更新的規(guī)模比起英偉達還有所差距,但也代表了廠商持續(xù)優(yōu)化性能表現(xiàn)的決心。

寫在最后

其實從越來越多的廠商進軍GPU,越來越多的GPU廠商發(fā)力AI就可以看出,即便CUDA有著深厚的生態(tài)積累,但在日新月異的AI中,其他廠商仍有分一杯羹的機會,甚至可能在某個應(yīng)用中后來者居上。但在圖形渲染相關(guān)的軟件生態(tài)上,廠商面臨的技術(shù)壁壘更加厚。不僅要帶著鉆研十數(shù)年的決心,還要持續(xù)打磨硬件產(chǎn)品,與產(chǎn)業(yè)軟件生態(tài)圈合作,挖掘和培養(yǎng)更多的圖形研究人才。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5177

    瀏覽量

    135235
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    127

    瀏覽量

    14459
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4077

    瀏覽量

    99016
  • 軟件生態(tài)系統(tǒng)

    關(guān)注

    0

    文章

    9

    瀏覽量

    7199
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RV生態(tài)又一里程碑:英偉達官宣CUDA將兼容RISC-V架構(gòu)!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)英偉達生態(tài)護城河CUDA,從最初支持x86、Power?CPU架構(gòu),到2019年宣布支持Arm?CPU,不斷拓展在數(shù)據(jù)中心的應(yīng)用生態(tài)。 在2019年至今的六年
    的頭像 發(fā)表于 07-19 00:04 ?6529次閱讀
    RV<b class='flag-5'>生態(tài)</b>又一里程碑:英偉達官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構(gòu)!

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢是允許開發(fā)者基于其構(gòu)建自定義的 DSL。
    的頭像 發(fā)表于 02-10 10:31 ?140次閱讀

    聲智科技亮相2026瑞芯微AI軟件生態(tài)大會

    近日,瑞芯微 AI 軟件生態(tài)大會在福州召開,這場大會匯聚了各行各業(yè)逾500位AI軟件生態(tài)伙伴,包括業(yè)內(nèi)主流的基座模型伙伴、頭部AI軟件/算法
    的頭像 發(fā)表于 02-01 10:25 ?521次閱讀

    NVIDIA CUDA Tile的創(chuàng)新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA CUDA 平臺發(fā)明以來,最大的一次技術(shù)進步。這一令人振奮的創(chuàng)新引入了一套面向
    的頭像 發(fā)表于 12-24 10:17 ?434次閱讀
    NVIDIA <b class='flag-5'>CUDA</b> Tile的創(chuàng)新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1153次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2164次閱讀

    首款全國產(chǎn)訓推一體AI芯片發(fā)布,兼容CUDA生態(tài)

    CUDA生態(tài)體系。該芯片支持從單機多卡到千卡級集群的靈活擴展,能效比達3.41 TFLOPS/W——在同等功
    的頭像 發(fā)表于 11-30 07:20 ?9468次閱讀
    首款全國產(chǎn)訓推一體AI芯片發(fā)布,兼容<b class='flag-5'>CUDA</b><b class='flag-5'>生態(tài)</b>

    弱電智能化中究竟有多少個子系統(tǒng)?

    子系統(tǒng),每個子系統(tǒng)都承擔著特定的功能,共同為建筑提供全面的智能化服務(wù)。隨著技術(shù)的不斷進步,弱電智能化系統(tǒng)的子系統(tǒng)也在不斷發(fā)展和完善。那么,弱電智能化中究竟有多少個子系統(tǒng)呢?本文將詳細列舉并介紹這些子系統(tǒng)。 一
    的頭像 發(fā)表于 11-24 09:57 ?839次閱讀
    弱電智能化中<b class='flag-5'>究竟有</b>多少個子系統(tǒng)?

    潤和軟件及潤開鴻出席鴻蒙生態(tài)大會2025

    )理事單位及鴻蒙生態(tài)核心伙伴,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)及旗下子公司江蘇潤開鴻數(shù)字科技有限公司(以下簡稱“潤開鴻”)共同出席大會,參與見證多項重磅標準發(fā)布,并通過行業(yè)議題分享、創(chuàng)新場景成果展示等呈現(xiàn)了自身面
    的頭像 發(fā)表于 09-06 19:14 ?2666次閱讀

    普華基礎(chǔ)軟件亮相2025智能汽車基礎(chǔ)軟件生態(tài)大會

    8月28日—29日,2025智能汽車基礎(chǔ)軟件生態(tài)大會暨第四屆中國汽車芯片大會在重慶渝州賓館盛大召開。29日上午舉辦的2025智能汽車基礎(chǔ)軟件生態(tài)大會上,來自政、產(chǎn)、學、研、用等領(lǐng)域的5
    的頭像 發(fā)表于 09-03 16:43 ?1408次閱讀

    Microsoft AD究竟有多重要

    勒索軟件攻防已成一場永無止境的貓鼠游戲——在IT和安全團隊不斷提升能力的同時,攻擊者也在不斷尋找新的攻擊路徑,而AD作為集中管理的核心要素,已成為勒索軟件攻擊的主要目標和執(zhí)行路徑。
    的頭像 發(fā)表于 07-22 13:57 ?738次閱讀

    FOC電機控制究竟該如何學?

    學習FOC電機控制究竟是學哪些內(nèi)容? 電機知識 軟件知識 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點贊、評論支持一下哦~)
    發(fā)表于 05-09 14:09

    福祿克ST20MAX紅外測溫儀究竟有多好用

    “精準測量、智能預約、堅固耐用、貼心設(shè)計…” 小福帶著首批ST20MAX客戶試用心得來啦!ST20MAX 究竟有多好用?讓我們一探究竟
    的頭像 發(fā)表于 04-10 13:55 ?809次閱讀

    串口服務(wù)器究竟有何用途?看完這個你就恍然大悟了!

    在當今數(shù)字化快速發(fā)展的時代,串口服務(wù)器作為一種重要的網(wǎng)絡(luò)設(shè)備,正悄然在各個領(lǐng)域發(fā)揮著關(guān)鍵作用。今天,我們就來深入了解一下串口服務(wù)器究竟有何用途。 工業(yè)自動化領(lǐng)域:保障生產(chǎn)高效穩(wěn)定運行 在工業(yè)生產(chǎn)
    的頭像 發(fā)表于 03-25 12:43 ?764次閱讀

    潤和軟件榮獲華為“生態(tài)星火燎原獎”

    近日,以“同行致遠,聚勢江來”為主題的華為江蘇合作伙伴大會在南京成功舉辦。江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)作為華為生態(tài)體系的重要伙伴受邀參會,并憑借在生態(tài)共建、技術(shù)賦能
    的頭像 發(fā)表于 03-24 11:48 ?998次閱讀