国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

釋放GPU的處理潛力

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:DUNCAN YOUNG ? 2022-11-07 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高性能圖形處理單元 (GPU) 的內(nèi)部計算架構(gòu)已從固定功能圖形執(zhí)行單元發(fā)展為完全可編程的單指令多數(shù)據(jù) (SIMD) 處理器陣列。這種演變是由視頻游戲社區(qū)的需求推動的,即并行執(zhí)行通用物理計算,以使煙霧、碎片、火災(zāi)和流體等行為更加逼真。將這些相同類型的重復(fù)并行計算卸載和加速到 GPU 上的能力為雷達、聲納和圖像處理等軍事技術(shù)提供了巨大的潛力。高效實施的關(guān)鍵是新一代工具,如 OpenCL 和 CUDA,它們集成了跨異構(gòu) CPU/GPU 架構(gòu)的代碼開發(fā)以及支持它們的內(nèi)存和 I/O 帶寬。

單邊處理光線

高性能 GPU 設(shè)備的核心通常具有多達 128 個 32 位單精度處理器內(nèi)核,主頻為 1 GHz 或更高。它們被組織為并行 SIMD 陣列,以便處理器組可以在不同的數(shù)據(jù)集上并行執(zhí)行相同的指令。作為 GPU 運行時,主要要求是利用動畫 3D 圖形功能,例如著色器。然而,GPU 正在從特定的著色器處理器演變而成為更通用的數(shù)學(xué)處理器,現(xiàn)在稱為“流處理器”。借助正確的工具,GPU 可以更廣泛地應(yīng)用于加速多種基于 PC 的應(yīng)用程序,例如基因研究、地震處理、氣象處理和 DSP,其成本遠低于其他更具體的硬件加速形式。

一家主要的GPU制造商NVIDIA開發(fā)了一種稱為CUDA的軟件環(huán)境,以將GPU的潛力釋放到這些其他應(yīng)用領(lǐng)域。CUDA 通過允許通過隱藏 GPU 流處理器及其與 CPU 接口的抽象函數(shù)庫進行內(nèi)聯(lián) C 代碼開發(fā)來支持 CPU 和 GPU 的組合。這提供了一個非常靈活的編程接口,并允許將來對流處理器進行增長甚至根本性更改,而不會影響現(xiàn)有代碼。為了減少錯誤的范圍,CUDA 采用簡單的編程模型,在內(nèi)部管理多個線程以優(yōu)化處理器利用率,因此無需編寫顯式線程代碼。

沒有圖形的圖形 GPU

矛盾的是,會有一類嵌入式應(yīng)用程序根本不會生成任何本地圖形輸出。通常,此類可能包括無人機或水下遙控車輛(ROV)或許多其他類型的無人傳感器中的圖像處理。具有 GPU 的嵌入式 PC 成為圖像增強、穩(wěn)定、模式識別、目標跟蹤、視頻編碼或加密/解密的理想平臺。這些都是可以用常規(guī) C 代碼編寫以在高性能 PC 上運行的應(yīng)用程序,但可以通過 GPU 流處理器加速以運行速度快幾個數(shù)量級。GPU 提供已經(jīng)集成到許多 PC 配置中的通用并行處理,并且通過使用現(xiàn)成的工具(如 CUDA、MathWorksMATLAB 和移植的 VSIPL DSP 庫)來構(gòu)建、測試和驗證應(yīng)用程序,需要的專業(yè)技能低于 FPGA 開發(fā)。

PCI Express 是性能的關(guān)鍵

嵌入式傳感器處理應(yīng)用需要高數(shù)據(jù)帶寬來接收和處理連續(xù)的傳入原始圖像數(shù)據(jù)流。CUDA 處理多線程并因此最大化 GPU SIMD 陣列的處理負載的能力取決于外部接口及其本地內(nèi)存接口的性能。高端GPU設(shè)備將使用16通道PCI Express 2.0,是早期PCI Express 1.0數(shù)據(jù)速率的兩倍,理論上每通道500 MBps。對于堅固耐用的嵌入式應(yīng)用,這非常適合VPX (ANSI/VITA 46)封裝標準的流行3U和6U格式,并具有擴展的高速連接性。GE Fanuc Intelligent Platforms的MAGIC1強固型嵌入式PC(如圖1所示)基于3U VPX外形,并經(jīng)過重新設(shè)計和增強,以支持NVIDIA支持CUDA的GPU。雖然這種嵌入式PC非常適合3U格式,但6U配置文件還具有空間和更大的連接性,有可能基于許多多核處理器和GPU使用PCI Express 2.0作為互連的新型強大多計算引擎。

GPU 正在迅速發(fā)展,創(chuàng)造了一種處理能力,可在許多不同的市場中得到廣泛的應(yīng)用。CUDA 和類似的開發(fā)環(huán)境提供了對這種未開發(fā)性能儲備的可訪問性。因此,堅固耐用的軍事和航空航天領(lǐng)域似乎將改變復(fù)雜、耗時的傳感器應(yīng)用的開發(fā)、測試、驗證和成功部署方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252273
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135450
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢是允許開發(fā)者基于其構(gòu)建自定義的 DS
    的頭像 發(fā)表于 02-10 10:31 ?243次閱讀

    恩智浦全新S32N7處理釋放軟件定義汽車(SDV)的全部潛力

    · S32N7處理器系列實現(xiàn)核心車輛功能的全面數(shù)字化和集中化 · 汽車制造商能夠降低系統(tǒng)復(fù)雜性,并在整個車隊釋放AI驅(qū)動的創(chuàng)新潛力 · 博世率先在其車輛集成平臺中部署S32N7 拉斯維加斯國際消費
    的頭像 發(fā)表于 01-19 17:06 ?6.6w次閱讀
    恩智浦全新S32N7<b class='flag-5'>處理</b>器<b class='flag-5'>釋放</b>軟件定義汽車(SDV)的全部<b class='flag-5'>潛力</b>

    汽車中的GPU是如何使用的?

    (HMI)的發(fā)展尤為迅猛。隨著電子電氣架構(gòu)(EEA)的集中化,車輛對高性能計算能力的需求顯著提升,GPU(圖形處理單元)的靈活性、可擴展性以及高效并行計算能力,使其成為支持這些創(chuàng)新應(yīng)用的核心組件
    的頭像 發(fā)表于 12-03 14:45 ?9578次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    如何通過交替式幾何處理實現(xiàn)更優(yōu)的多核?GPU?擴展

    在理論上,通過增加更多GPU核心來提升性能似乎很簡單:核心越多,性能越強。但在實踐中,這是圖形架構(gòu)領(lǐng)域最棘手的挑戰(zhàn)之一。雖然某些工作負載因其獨立特性能實現(xiàn)良好擴展,但另一些工作負載(尤其是幾何處理
    的頭像 發(fā)表于 12-01 10:12 ?647次閱讀
    如何通過交替式幾何<b class='flag-5'>處理</b>實現(xiàn)更優(yōu)的多核?<b class='flag-5'>GPU</b>?擴展

    戴爾科技PowerStore如何釋放QLC閃存全部潛力

    轉(zhuǎn)眼間,QLC SSD問世已有幾個年頭,從問世之初被質(zhì)疑的“短命鬼”,到如今市場的又一大主流選擇,QLC和它的前輩們一樣,在批判中前進,在螺旋中上升。
    的頭像 發(fā)表于 11-30 09:25 ?650次閱讀

    基于米爾RK3576的環(huán)視實時性方案解析

    ,造成嚴重卡頓和延遲,也使得CPU再無余力處理其他系統(tǒng)任務(wù),此方案不具備產(chǎn)品化價值。GPU方案:潛力巨大,穩(wěn)定性是當前關(guān)鍵瓶頸卓越的算力體現(xiàn): 在畸變矯正和投影變換環(huán)節(jié),Mali-G52 GP
    發(fā)表于 11-28 16:57

    Dell PowerScale助力企業(yè)充分釋放GPU投資價值

    盡管算力層面的“軍備競賽”仍在持續(xù)加劇,但隨著GPU集群規(guī)模擴展至數(shù)千臺服務(wù)器,存力作為支撐算力持續(xù)運行的關(guān)鍵要素,已獲得與算力同等重要的戰(zhàn)略地位。
    的頭像 發(fā)表于 11-06 09:06 ?707次閱讀

    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新釋放 KUAE 集群潛能,引領(lǐng) GPU 計算新高度?

    的分享。GPU 計算軟件開發(fā)總監(jiān)吳慶登上講臺,發(fā)表了題為《摩爾線程 MUSA 軟件棧助力 KUAE 集群釋放無限潛能》的演講。他從專業(yè)視角出發(fā),為在場聽眾深入剖析了 MUSA 軟件棧在驅(qū)動 KUAE 集群高效運轉(zhuǎn)方面的核心技術(shù)與創(chuàng)新成果。 ? 摩爾線程
    的頭像 發(fā)表于 07-28 13:47 ?6080次閱讀
    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新<b class='flag-5'>釋放</b> KUAE 集群潛能,引領(lǐng) <b class='flag-5'>GPU</b> 計算新高度?

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)
    的頭像 發(fā)表于 05-30 10:36 ?1855次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計的圖形處理器(GPU)IP 核,憑借其異構(gòu)計算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動
    的頭像 發(fā)表于 05-29 10:12 ?4326次閱讀

    高效地擴展Polars GPU Parquet讀取器

    處理大型數(shù)據(jù)集時,數(shù)據(jù)處理工具的性能至關(guān)重要。Polars 作為一個以速度和效率著稱的開源數(shù)據(jù)處理庫,它提供了由 cuDF 驅(qū)動的 GPU 加速后端,能夠顯著提升性能。
    的頭像 發(fā)表于 04-21 17:12 ?900次閱讀
    高效地擴展Polars <b class='flag-5'>GPU</b> Parquet讀取器

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅(qū)動工作負載提供動力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1433次閱讀

    可以手動構(gòu)建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發(fā)表于 03-28 06:35