国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

詳細介紹GPGPU計算的原理和應用

lC49_半導體 ? 來源:yxw ? 作者:Daniel Mor ? 2019-08-27 09:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當下,嵌入式系統設計主要面臨兩個困難,可將其歸納為:算力的損失和功耗的增加。主要的“罪魁禍首”包括:數據源的涌入(influx),技術的持續升級,系統規模的縮小以及系統內部密度的增加。

高性能嵌入式計算機(HPEC)系統已經開始在通用圖形處理器單元(GPGPU)上利用專用的并行計算速度和性能,使系統設計人員能夠將出色的功率和性能帶入堅固耐用的小型化設計(SFFs)。

GPU加速計算將圖形處理單元(GPU)與中央處理單元(CPU)結合在一起,以加速應用程序,并將一些計算密集型任務從CPU移到到GPU。

這里,需要特別關注的是,隨著處理要求的不斷提高,主計算引擎——CPU——最終會不堪重負。而GPU已經發展成為一種極其靈活且強大的處理器,并且由于具有改進的可編程性、精度和并行處理能力,可以比CPU更好、更快地處理某些計算任務。

如果能深入了解GPGPU計算,包括其強大的功能和局限性,可以幫助設計人員為應用選擇能提供最佳性能的產品。

下面,我們就來分析一下關于GPGPU的11種說法和認知,看哪些是對的,哪些是錯的。

1.GPGPU只適用于消費類電子產品,如游戲中的圖形渲染

這種說法不對。正如過去幾年所展示的那樣,GPGPU正在重新定義數據處理和深度學習網絡方面的能力,以及塑造著其在人工智能領域的形象和期望。且有越來越多基于GPGPU技術的軍事和國防項目在應用中部署,包括用于雷達的先進處理能力,圖像識別,分類,運動檢測,編碼等系統。

2.因為是“通用的”,所以GPU不是為處理復雜的高密度計算任務而設計的

這種說法也是錯的。典型的強大RISC或CISC CPU具有數十個復雜核心。GPU具有數千個“專用”內核,經過優化可處理和操作大型數據矩陣,如顯示器或輸入設備和光學相機(見圖1)。這些GPU允許應用程序在多個內核之間共享算法,并且更容易構建和執行并行處理。能夠在GPU上創建許多并發“內核” ——每個“內核”負責特定計算的子集——使系統能夠執行復雜的高密度計算。

圖1:雖然多核CPU能提供增強的處理能力,但基于CUDA的GPU可提供數千個并行運行,并同時處理大量數據的內核。

GPGPU管道在GPU上使用并行處理來分析數據,就好像它是圖像或其他圖形數據一樣。雖然GPU在較低頻率下運行,但它們通常具有許多核心數量。因此,與傳統CPU相比,GPU每秒可以處理更多的圖片和圖形數據。使用GPU并行管道掃描和分析圖形數據可以實現大幅加速。

3.GPGPU不夠堅固,無法承受如井下監測、移動或軍事應用等惡劣環境

錯。加固的責任實際上是在電路板或系統制造商身上。在惡劣的電子環境中使用的許多零部件在制造時并不堅固,這方面,GPGPU與其它器件相同。這時,就需要設計可靠系統的知識發揮作用了,包括哪種技術可以最好地減輕環境危害等因素的影響,并確保系統滿足特定的應用要求。

例如, Aitech擁有基于GPGPU的電路板和SFF系統,這些電路板和SFF系統符合許多航空電子設備,海軍,地面和移動應用要求,這得益于其數十年積累起來的、可用于系統開發的專業知識。

4.當處理能力超出系統要求時,替代方案需要增加功耗(即購買功能更強大的硬件)

這種說法是對的。如果用戶試圖避免使用GPGPU,通常會導致CPU性能不足。為了嘗試解決這個難題,通常會增加額外的CPU板,或者現有的板會超頻,從而導致功耗增加。在大多數情況下,結果是降低了CPU頻率性能以及需要降低時鐘以補償芯片溫度上升。

5.不添加另一個處理引擎會增加系統中的復雜性和集成問題嗎?

在短期內,也許是這樣,因為您需要考慮使用新的尖端技術的學習曲線。但從長遠來看,不是這樣。CUDA已成為圖像處理和算法的事實上的計算語言。構建CUDA算法后,您可以在支持NVIDIA GPGPU板的任何不同平臺上“重復使用”它。將它從一個平臺移植到另一個平臺很容易,因此,該方法只需要很少的特定硬件,因此更“通用”。

6.由于基于GPGPU的系統處理極大量的數據,因此會增加功耗

不是的。當今的GPGPU非常節能。一些GPGPU板的功耗與CPU板上的功耗相同。GPGPU板可以使用數千個CUDA內核處理更多的并行數據。因此,功率 - 性能比是以非常積極的方式受到影響的因素。

7.在性能和功耗之間仍需要權衡

是的,這些權衡總是存在的。更高的性能和更快的吞吐量需要更多的功耗,這是事實。但這些是您在使用CPU或其它處理器時,同樣需要面對的問題,無一例外。

例如,采用“NVIDIA Optimus技術”時,由于它是一種計算機GPU切換技術,其中,獨立GPU處理所有渲染任務,最終圖像輸出到顯示器仍由RISC處理器及其集成圖形處理器(IGP)處理。實際上,RISC CPU的IGP僅用作簡單的顯示控制器,從而實現無縫、實時、無閃爍的體驗,無需在GPGPU或共享CPU上承擔圖像渲染和生成的全部負擔所有RISC CPU上的圖像識別資源。這種負載共享可使系統更加強大。

當運行不太關鍵或要求較低的應用程序時,可以關閉獨立GPU。英特爾IGP可處理渲染和顯示調用,以節省電量并提供最高的性能功耗比。

8.平衡CPU上的負載可以通過簡單的電路板升級來完成,且足以管理系統所需的數據處理

錯。對于這種情況,業界肯定會采用并行處理,即采用GPU處理,這是有充分理由的。并行處理圖像是GPU最擅長的。隨著數據輸入和攝像機分辨率的不斷增長,對并行處理架構的需求將成為常態,而不是奢侈品。對于需要同時捕獲、比較、分析和決策數百個圖像的任務和安全行業尤其如此(見圖2)。

圖2:隨著數據輸入的增加,CPU在處理、負載平衡和時鐘要求方面的能力將無法滿足實際要求。

9.摩爾定律也適用于GPGPU

是的。有一個解決方案。NVIDIA目前正在對多芯片模塊GPU(MCM-GPU)架構進行原型設計,盡管當今的集成電路制程工藝升級越來越困難,晶體管微縮速度明顯減緩,但該架構可實現持續的GPU性能擴展。

在GTC 2019上,NVIDIA關于MCM-GPU芯片的討論部分,特別介紹了許多可應用于更高級別計算系統的技術,包括mesh網絡,低延遲信令和可擴展的深度學習架構,以及有機基板上的die-to-die高效傳輸技術。

10.學習一種全新的編程語言(如CUDA)需要花費太多的時間和金錢投入

實際上,并不是這樣的。目前,CUDA是事實上的并行計算標準語言,且市場上已經部署了許多基于CUDA的解決方案,因此,許多算法已經移植到了CUDA。NVIDIA有一個大型的在線論壇,有許多應用案例,網絡培訓課程,用戶社區等。此外,軟件公司愿意幫助設計人員完成CUDA的入門。在許多大學,CUDA現在是編程語言課程的一部分。

學習任何新的計算技術似乎都會令人生畏。但是,憑借可用資源和GPGPU技術的廣闊前景,這是一種非常值得投資的編程語言。

11.嵌入式市場沒有“工業級”GPGPU,特別是SFF,SWaP優化系統

錯。NVIDIA擁有一套完整的、面向嵌入式市場的“Jetson”產品線(見圖3)。目前包括以下系統模塊(SoM),每個模塊都采用SFF設計,對其尺寸、重量和功耗都進行了優化。

TX1

TX2

TX2i:特殊的“工業”版本,適用于非常“惡劣”的環境

Xavier

圖3:專為工業級和軍用級應用而設計的GPGPU,正在重新定義SWaP優化和SFF系統的預期性能。

實際上,NVIDIA推出了具有更長生命周期的TX2i模塊,這意味著對于長期計劃(如航空航天、國防和太空)以及幾種工業應用來說,組件過時風險較小。業界已經部署了許多相應的軍事和工業項目以及客戶計劃,每天都有新的應用推出。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 半導體
    +關注

    關注

    339

    文章

    30746

    瀏覽量

    264325
  • 嵌入式
    +關注

    關注

    5199

    文章

    20451

    瀏覽量

    334221
  • 計算機
    +關注

    關注

    19

    文章

    7807

    瀏覽量

    93211
  • 人工智能
    +關注

    關注

    1817

    文章

    50100

    瀏覽量

    265497
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國產GPGPU集體爆發!沐曦登陸科創板,龍芯也宣布了

    電子發燒友網報道(文/莫婷婷)通用圖形處理器(GPGPU)作為融合圖形處理與通用并行計算能力的協處理器,已成為AI、大數據分析等高性能計算場景的核心基礎設施。目前,全球 GPGPU
    的頭像 發表于 12-17 07:19 ?1.1w次閱讀
    國產<b class='flag-5'>GPGPU</b>集體爆發!沐曦登陸科創板,龍芯也宣布了

    電解電容正負極接法的詳細介紹

    電解電容是一種具有極性的電容器,其正負極接法至關重要,接反可能導致電容損壞、漏液、爆炸,甚至引發電路故障或安全事故。以下是電解電容正負極接法的詳細介紹: 一、電解電容正負極的識別方法 1、外觀標識
    的頭像 發表于 03-05 17:45 ?1025次閱讀
    電解電容正負極接法的<b class='flag-5'>詳細</b><b class='flag-5'>介紹</b>

    屏蔽雙絞網線的應用場景詳細介紹

    屏蔽雙絞網線( STP)憑借其出色的抗電磁干擾(EMI)和射頻干擾(RFI)能力,以及增強的數據傳輸穩定性和安全性,在多個領域得到了廣泛應用。以下是對屏蔽雙絞網線主要應用場景的詳細介紹: 1.
    的頭像 發表于 02-27 10:17 ?60次閱讀

    詳細介紹溫補晶振的關鍵參數

    )是一種性能更優異的晶振類型,它能夠自動調節其頻率以適應環境溫度的變化。本文將詳細介紹溫補晶振的關鍵參數。一、頻率范圍溫補晶振的頻率范圍通常在20MHz至36MHz之
    的頭像 發表于 02-26 16:25 ?6089次閱讀
    <b class='flag-5'>詳細</b><b class='flag-5'>介紹</b>溫補晶振的關鍵參數

    能否詳細介紹一下MOSFET在電機控制中的作用是什么?

    能否詳細介紹一下MOSFET在電機控制中的作用?
    發表于 12-22 13:11

    Montgomery模乘介紹

    Montgomery模乘介紹 Montgomery 模乘算法是最有效的大整數模乘算法之一它的一個顯著特點是消除了mod n 的除法運算。Montgomery 算法的基本思想是計算 ,設n為k比特
    發表于 10-22 07:35

    rvs是什么線?rvs線纜的詳細介紹

    RVS線是銅芯聚氯乙烯絕緣絞型連接用軟電線,俗稱雙絞線、花線或消防線。以下是對RVS線的詳細介紹: 一、命名與構成 R:代表軟線,即導體由多根細銅絲絞合而成,使得電線柔軟易彎曲。 V:代表絕緣層為
    的頭像 發表于 10-14 15:45 ?2079次閱讀

    2KW逆變側功率管的損耗如何進行計算詳細公式免費下載

    本文檔的主要內容詳細介紹的是2KW逆變側功率管的損耗如何進行計算詳細公式免費下載。
    發表于 08-29 16:18 ?34次下載

    請問LTM4680輸出電壓配置電阻如何準確計算

    手冊描述LTM4680可在VOUTn_CFG引腳與GND之間連入不同阻值的電阻配置不同的輸出電壓,手冊table 1給了一些特定的離散值,但是手冊中沒有給出詳細計算公式。 某些asic對供電電壓
    發表于 06-19 06:07

    芯原可擴展的高性能GPGPU-AI計算IP賦能汽車與邊緣服務器AI解決方案

    芯原股份 (芯原,股票代碼:688521.SH) 日前宣布其 高性能、可擴展的GPGPU-AI計算IP的最新進展,這些IP現已為新一代汽車電子和邊緣服務器應用提供強勁賦能 。通過將可編程并行計算能力
    的頭像 發表于 06-16 10:44 ?1376次閱讀

    PID控制原理知識詳細文檔【推薦下載】

    文檔詳細介紹了控制系統歷程、控制系統概況、反饋控制原理圖、閉環控制系統的例子等內容,具體的建議下載查看。 這是部分截圖:
    發表于 05-22 17:37

    測徑儀濾光鏡片詳細介紹

    關鍵字:測徑儀鏡片,測徑儀濾光鏡片,測徑儀濾光原因,測頭濾光步驟,濾光步驟, 測徑儀濾光鏡片,特別是針對激光測距儀的濾光片,是一種高精度的光學元件。以下是對測徑儀濾光鏡片的詳細解析: 一、作用與功能
    發表于 05-20 18:03

    開關電源拓撲結構介紹

    的選擇可能會從一開始就給電源設計帶來厄運。 正確選擇并合理應用各種拓撲對于整個電路設計來說至關重要。本文將對常見的開關電源基本拓撲進行詳細介紹,讓讀者能夠更快更好地了解和使用這些拓撲。 開關電源的10
    發表于 05-12 16:04

    變壓器速查速算手冊(完整版)

    資料介紹本文較詳細而系統地介紹了變壓器的計算公式和計算方法。內容包括:變壓器基本計算及試驗
    發表于 04-30 17:40

    黑芝麻A2000#高階智能駕駛與通用AI計算芯片詳細解析

    黑芝麻智能A2000芯片是面向下一代AI模型設計的車規級高算力芯片平臺,旨在推動全場景通識智駕的普及與高階自動駕駛技術的突破。以下從技術架構、性能特點、應用場景及市場定位等多維度進行詳細解析: 一
    的頭像 發表于 04-30 10:33 ?6967次閱讀
    黑芝麻A2000#高階智能駕駛與通用AI<b class='flag-5'>計算</b>芯片<b class='flag-5'>詳細</b>解析