国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU和GPU大不相同,究竟原因在哪?

5RJg_mcuworld ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-10-26 06:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在北京舉辦的NVIDIA GTC China會議中,無論是AI智能運算,還是服務(wù)器數(shù)據(jù)中心、智能城市,甚至還有去年很火熱但是已經(jīng)很多人已經(jīng)支撐不下去的虛擬現(xiàn)實,看起來在很多內(nèi)心中依然是屬于圖形行業(yè)代表的NVIDIA已經(jīng)變得越來越豐滿,不過在這些新聞的背后,似乎還有更大膽的預(yù)言:摩爾定律已死,GPU最終會取代CPU

摩爾定律是由英特爾Intel)創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出來的。其內(nèi)容為:當(dāng)價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18-24個月翻一倍以上。這一定律揭示了信息技術(shù)進(jìn)步的速度。

概要:CPU和GPU之所以大不相同,是由于其設(shè)計目標(biāo)的不同,它們分別針對了兩種不同的應(yīng)用場景。

盡管這種趨勢已經(jīng)持續(xù)了超過半個世紀(jì),摩爾定律仍應(yīng)該被認(rèn)為是觀測或推測,而不是一個物理或自然法。然而,2010年國際半導(dǎo)體技術(shù)發(fā)展路線圖的更新增長已經(jīng)放緩在2013年年底,之后的時間里晶體管數(shù)量密度預(yù)計只會每三年翻一番。

CPU和GPU之所以大不相同,是由于其設(shè)計目標(biāo)的不同,它們分別針對了兩種不同的應(yīng)用場景。CPU需要很強的通用性來處理各種不同的數(shù)據(jù)類型,同時又要邏輯判斷又會引入大量的分支跳轉(zhuǎn)和中斷的處理。這些都使得CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜。而GPU面對的則是類型高度統(tǒng)一的、相互無依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計算環(huán)境。于是CPU和GPU就呈現(xiàn)出非常不同的架構(gòu)。

GPU采用了數(shù)量眾多的計算單元和超長的流水線,但只有非常簡單的控制邏輯并省去了Cache。而CPU不僅被Cache占據(jù)了大量空間,而且還有有復(fù)雜的控制邏輯和諸多優(yōu)化電路,相比之下計算能力只是CPU很小的一部分

從上圖可以看出:Cache, local memory: CPU > GPU Threads(線程數(shù)): GPU > CPURegisters: GPU > CPU 多寄存器可以支持非常多的Thread,Thread需要用到register,Thread數(shù)目大,register也必須得跟著很大才行。SIMD Unit(單指令多數(shù)據(jù)流,以同步方式,在同一時間內(nèi)執(zhí)行同一條指令): GPU > CPU。 CPU 基于低延時的設(shè)計:

CPU有強大的ALU(算術(shù)運算單元),它可以在很少的時鐘周期內(nèi)完成算術(shù)計算。當(dāng)今的CPU可以達(dá)到64bit 雙精度。執(zhí)行雙精度浮點源算的加法和乘法只需要1~3個時鐘周期。CPU的時鐘周期的頻率是非常高的,達(dá)到1.532~3gigahertz(千兆HZ, 10的9次方),大的緩存也可以降低延時。保存很多的數(shù)據(jù)放在緩存里面,當(dāng)需要訪問的這些數(shù)據(jù),只要在之前訪問過的,如今直接在緩存里面取即可。復(fù)雜的邏輯控制單元。當(dāng)程序含有多個分支的時候,它通過提供分支預(yù)測的能力來降低延時。數(shù)據(jù)轉(zhuǎn)發(fā)。 當(dāng)一些指令依賴前面的指令結(jié)果時,數(shù)據(jù)轉(zhuǎn)發(fā)的邏輯控制單元決定這些指令在pipeline中的位置并且盡可能快的轉(zhuǎn)發(fā)一個指令的結(jié)果給后續(xù)的指令。這些動作需要很多的對比電路單元和轉(zhuǎn)發(fā)電路單元。

GPU是基于大的吞吐量設(shè)計。GPU的特點是有很多的ALU和很少的Cache,緩存的目的是保存后面需要訪問的數(shù)據(jù)的,這點和CPU不同,而是為Thread提高服務(wù)的。如果有很多線程需要訪問同一個相同的數(shù)據(jù),緩存會合并這些訪問,然后再去訪問dram(因為需要訪問的數(shù)據(jù)保存在dram中而不是Cache里面),獲取數(shù)據(jù)后Cache會轉(zhuǎn)發(fā)這個數(shù)據(jù)給對應(yīng)的線程,這個時候是數(shù)據(jù)轉(zhuǎn)發(fā)的角色。但是由于需要訪問dram,自然會帶來延時的問題。GPU的控制單元(左邊黃色區(qū)域塊)可以把多個的訪問合并成少的訪問。

GPU雖然有dram延時,卻有非常多的ALU和非常多的Thread,為了平衡內(nèi)存延時的問題,我們可以中充分利用多的ALU的特性達(dá)到一個非常大的吞吐量的效果。盡可能多的分配Threads。通常來看GPU ALU會有非常重的pipeline就是因為這樣。所以CPU擅長邏輯控制,串行的運算。和通用類型數(shù)據(jù)運算不同,GPU擅長的是大規(guī)模并發(fā)計算,這也正是密碼破解等所需要的。所以GPU除了圖像處理,也越來越多的參與到計算當(dāng)中來。

什么類型的程序適合在GPU上運行?

(1)計算密集型的程序。所謂計算密集型(Compute-intensive)的程序,就是其大部分運行時間花在了寄存器運算上,寄存器的速度和處理器的速度相當(dāng),從寄存器讀寫數(shù)據(jù)幾乎沒有延時。可以做一下對比,讀內(nèi)存的延遲大概是幾百個時鐘周期;讀硬盤的速度就不說了,即便是SSD, 也實在是太慢了。

(2)易于并行的程序。GPU其實是一種SIMD(Single Instruction Multiple Data)架構(gòu), 他有成百上千個核,每一個核在同一時間最好能做同樣的事情。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11277

    瀏覽量

    224954
  • 摩爾定律
    +關(guān)注

    關(guān)注

    4

    文章

    640

    瀏覽量

    80900
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135431

原文標(biāo)題:GPU會取代CPU的位置嗎?

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Keysight E4991B 與 E4990A 阻抗分析儀:深入技術(shù)對比與選型指南

    的高性能儀器。盡管它們都提供了卓越的測量能力,但各自的設(shè)計理念和性能側(cè)重點卻大不相同。 本文將深入剖析這兩款儀器的技術(shù)規(guī)格,幫助您做出最佳的選型決策。 一、 核心性能概覽 首先,我們可以通過下表快速了解兩款儀器的核心差異: 特性 Keysight E4991B Keysight
    的頭像 發(fā)表于 02-06 15:39 ?115次閱讀
    Keysight E4991B 與 E4990A 阻抗分析儀:深入技術(shù)對比與選型指南

    如何判斷廣州郵科逆變電源是電力用還是通信用?看這幾個關(guān)鍵區(qū)別就夠了!

    在電力系統(tǒng)和通信系統(tǒng)中,逆變電源都扮演著至關(guān)重要的角色,但兩者的技術(shù)要求卻大不相同。一臺設(shè)計用于通信機房的逆變電源,如果誤用在電力系統(tǒng),可能會導(dǎo)致保護(hù)誤動;反之亦然。今天我們就來詳細(xì)解析,如何準(zhǔn)確判斷廣州郵科的逆變電源究竟是電力專用型還是通信專用型。
    的頭像 發(fā)表于 01-27 10:41 ?144次閱讀
    如何判斷廣州郵科逆變電源是電力用還是通信用?看這幾個關(guān)鍵區(qū)別就夠了!

    分塊延遲渲染架構(gòu)能否在桌面領(lǐng)域立足?

    在桌面市場,顯卡所需的GPUIP要求則大不相同:高性能:主流顯卡需達(dá)到20TFLOPS算力與300GPixel/s渲染能力方能立足;高端游戲顯卡的性能標(biāo)準(zhǔn)更為嚴(yán)苛先
    的頭像 發(fā)表于 11-25 08:34 ?616次閱讀
    分塊延遲渲染架構(gòu)能否在桌面領(lǐng)域立足?

    SPI、I2C、I2S、UART:通信協(xié)議解釋

    ? ? ? ? 在嵌入式開發(fā)中,最常用的幾種通信接口無非就是SPI、I2C、I2S、UART。名字看起來差不多,但應(yīng)用場景和特性卻大不相同。為什么都叫串行通信,結(jié)構(gòu)卻不一樣?為什么有的能傳音頻,有的
    的頭像 發(fā)表于 11-18 10:53 ?534次閱讀

    SPI、I2C、I2S、UART:通信協(xié)議對比表

    在嵌入式開發(fā)中,最常用的幾種通信接口無非就是SPI、I2C、I2S、UART。名字看起來差不多,但應(yīng)用場景和特性卻大不相同。很多初學(xué)者容易混淆:為什么都叫串行通信,結(jié)構(gòu)卻不一樣?為什么有的能傳音頻
    的頭像 發(fā)表于 11-17 10:53 ?1731次閱讀
    SPI、I2C、I2S、UART:通信協(xié)議對比表

    實現(xiàn)環(huán)境計算真正的瓶頸究竟在哪

    20世紀(jì)90年代初,計算機科學(xué)家Mark Weiser提出了“泛在計算”的理念,其核心思想是讓技術(shù)融入日常生活環(huán)境中[1]。盡管智能家居組件、傳感器網(wǎng)絡(luò)和智能設(shè)備取得了進(jìn)展,但環(huán)境計算這一概念依然難以實現(xiàn)。如今,我們已經(jīng)擁有了硬件基礎(chǔ)和連接能力。那么,真正的瓶頸究竟在哪里?
    的頭像 發(fā)表于 09-10 16:21 ?817次閱讀

    CPUGPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計?

    渲染技術(shù)是計算機圖形學(xué)的核心內(nèi)容之一,它是將三維場景轉(zhuǎn)換為二維圖像的過程。渲染技術(shù)一直在不斷演進(jìn),從最初的CPU渲染到后來的GPU渲染,性能和質(zhì)量都有了顯著提升。從CPUGPU:技術(shù)
    的頭像 發(fā)表于 09-01 12:16 ?980次閱讀
    從 <b class='flag-5'>CPU</b> 到 <b class='flag-5'>GPU</b>,渲染技術(shù)如何重塑游戲、影視與設(shè)計?

    如何計算孔板流量計和平衡流量計的流量?計算公式一樣嗎?

    平衡流量計與孔板流量計作為差壓式流量計的典型代表,雖均基于壓力差與流量的數(shù)學(xué)關(guān)系進(jìn)行計算,但是平衡流量計計算公式和孔板流量計的計算公式大不相同,其核心公式、參數(shù)修正及適用場景存在顯著差異。這種
    的頭像 發(fā)表于 07-09 13:54 ?870次閱讀
    如何計算孔板流量計和平衡流量計的流量?計算公式一樣嗎?

    佳金源錫膏廠家為你總結(jié)錫膏的熔點為什么不相同

    熔點是固體將其物態(tài)由固態(tài)轉(zhuǎn)變或熔化為液態(tài)的溫度,那么關(guān)于錫膏的熔點,也是錫膏的膏體從膏狀經(jīng)高溫后熔化的溫度,我們平時所看到的錫膏是有很多種類的,不同類的錫膏熔點是不一樣的;錫膏是由不同的金屬粉末按一定比例與助焊劑或其他粉末合成的膏狀物料,而合金金屬成分的不同是導(dǎo)致錫膏熔點的差異的主要因素之一。
    的頭像 發(fā)表于 07-02 17:09 ?1231次閱讀
    佳金源錫膏廠家為你總結(jié)錫膏的熔點為什么<b class='flag-5'>不相同</b>?

    選晶振必須了解的:石英晶振分類全解析!

    在電子設(shè)備的設(shè)計制造當(dāng)中,石英晶振不可或缺,它為系統(tǒng)提供著穩(wěn)定而精準(zhǔn)的頻率基準(zhǔn),保障著電子器械的正常運行,常被譽為電子產(chǎn)品的“心臟”。石英晶振的種類繁多,不同分類的晶振應(yīng)用場景也大不相同。按封裝形式
    的頭像 發(fā)表于 06-12 10:00 ?1221次閱讀
    選晶振必須了解的:石英晶振分類全解析!

    UVC相機識別不到是什么原因導(dǎo)致的?

    我做了兩版硬件,一版可以識別到fx3相機,另一版找不到。 但是兩版都能測試USBBulkSourceSink.img,并且速率都在4Gbps以上。 有區(qū)別的是不能識別fx3相機的版本用的是52m的參考時鐘, 請問下可能的原因在哪里?
    發(fā)表于 05-22 06:53

    PLC為什么容易燒壞?主要原因在哪里?

    PLC(可編程邏輯控制器)作為工業(yè)自動化控制的核心設(shè)備,其穩(wěn)定性和可靠性直接影響生產(chǎn)線的運行效率。然而,在實際應(yīng)用中,PLC燒毀的故障并不罕見,這不僅會導(dǎo)致設(shè)備停機,還可能引發(fā)安全隱患。那么,究竟
    的頭像 發(fā)表于 05-12 08:42 ?3119次閱讀
    PLC為什么容易燒壞?主要<b class='flag-5'>原因在哪</b>里?

    變頻器相同的故障原因不同的故障代碼分類

    變頻器相同的故障原因可能對應(yīng)不同的故障代碼,這主要取決于變頻器的型號、制造商以及具體的故障檢測機制。以下是一些常見的故障原因及其可能對應(yīng)的不同故障代碼分類: 一、過電流故障 ● 故障原因
    的頭像 發(fā)表于 04-25 14:31 ?2537次閱讀
    變頻器<b class='flag-5'>相同</b>的故障<b class='flag-5'>原因</b>不同的故障代碼分類

    無刷直流電機控制簡介(可下載)

    , 因而已在許多應(yīng)用中取代了有刷電機兩類電機的運行原理相似,均由永磁體和電磁體的磁極吸引和排斥產(chǎn)生旋轉(zhuǎn)運動。但這些電機的控 制方式卻大不相同。BLDC 需要復(fù)雜的控
    發(fā)表于 03-19 14:29 ?2次下載

    無法在GPU上運行ONNX模型的Benchmark_app怎么解決?

    CPUGPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發(fā)表于 03-06 08:02