伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力呢

Dbwd_Imgtec ? 來源:未知 ? 作者:李建兵 ? 2018-03-16 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

問:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?


「速度區(qū)別主要是來自于架構(gòu)上的區(qū)別」是一個表面化的解釋。對,架構(gòu)是不同。但是這種不同是目前各個廠家選擇的現(xiàn)狀,還是由于本質(zhì)的原因決定的?CPU 能不能增加核?GPU 那張圖為什么不需要 cache?

首先,CPU 能不能像 GPU 那樣去掉 cache?不行。GPU 能去掉 cache 關(guān)鍵在于兩個因素:數(shù)據(jù)的特殊性(高度對齊,pipeline 處理,不符合局部化假設(shè),很少回寫數(shù)據(jù))、高速度的總線。對于后一個問題,CPU 受制于落后的數(shù)據(jù)總線標(biāo)準(zhǔn),理論上這是可以改觀的。對于前一個問題,從理論上就很難解決。因為 CPU 要提供通用性,就不能限制處理數(shù)據(jù)的種類。這也是 GPGPU 永遠無法取代 CPU 的原因。

其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面積。其次,CPU 為了維護 cache 的一致性,要增加每個核的復(fù)雜度。還有,為了更好的利用 cache 和處理非對齊以及需要大量回寫的數(shù)據(jù),CPU 需要復(fù)雜的優(yōu)化(分支預(yù)測、out-of-order 執(zhí)行、以及部分模擬 GPU 的 vectorization 指令和長流水線)。所以一個 CPU 核的復(fù)雜度要比 GPU 高的多,進而成本就更高(并不是說蝕刻的成本高,而是復(fù)雜度降低了成片率,所以最終成本會高)。所以 CPU 不能像 GPU 那樣增加核。

至于控制能力,GPU 的現(xiàn)狀是差于 CPU,但是并不是本質(zhì)問題。而像遞歸這樣的控制,并不適合高度對齊和 pipeline 處理的數(shù)據(jù),本質(zhì)上還是數(shù)據(jù)問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11315

    瀏覽量

    225710
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5249

    瀏覽量

    136008

原文標(biāo)題:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深入解析TS68882:高性能浮點協(xié)處理器的技術(shù)探秘

    深入解析TS68882:高性能浮點協(xié)處理器的技術(shù)探秘 在當(dāng)今的電子世界中,高性能浮點運算能力對于許多應(yīng)用場景來說至關(guān)重要。TS68882作為一款增強型
    的頭像 發(fā)表于 04-08 15:20 ?91次閱讀

    CW32F030C8T7是否支持浮點運算

    CW32F030C8T7是否支持浮點運算?如果需要執(zhí)行復(fù)雜的數(shù)**算,應(yīng)該如何處理?
    發(fā)表于 12-12 06:51

    為什么FPU在MCU中很重要

    核心去處理其他任務(wù)(如控制邏輯、通信、中斷處理),提高了系統(tǒng)的整體響應(yīng)能力和多任務(wù)處理能力。 降低功耗: 由于計算速度大大加快,完成相同計算任務(wù)所需的時間顯著縮短,CPU 可以更快地
    發(fā)表于 11-18 07:05

    蜂鳥內(nèi)核模塊浮點指令運算數(shù)據(jù)的獲取

    核中是如何獲取所需的兩個操作數(shù)。 我們以浮點加法運算為例。 首先,經(jīng)過分析我們發(fā)現(xiàn)整型指令寄存器的例化是通過循環(huán)完成的,所以我們可以用相同的方式例化32個32位浮點寄存器,相關(guān)代碼如下: 我們進入例
    發(fā)表于 10-24 13:39

    E203添加浮點數(shù)方法:FPU控制邏輯

    。 2. FPU 設(shè)計 要實現(xiàn)整一個 FPU 及其控制單元,首先要確定指令周期,以及浮點運算的方式。 由于筆者首次使用 Verilog 設(shè)計修改 CPU,因此為了減少錯誤、方便后續(xù)修改,筆者將單精度
    發(fā)表于 10-24 13:28

    蜂鳥E203的浮點指令集拓展(F拓展)

    關(guān)于蜂鳥E203的浮點指令集拓展(F拓展) Whetstone中有很多浮點數(shù)運算,而蜂鳥e203中沒有硬件支持,是通過將浮點數(shù)轉(zhuǎn)化成整型數(shù)來計算,效率大大降低。 為了
    發(fā)表于 10-24 11:51

    FPNew開源浮點運算單元工程建立

    在添加浮點運算單元時,可以引用開源的浮點運算器以簡化所需工作任務(wù)壓力。在此我們采用了FPnew這個開源工程,再次介紹一些如何將其導(dǎo)成vivado工程。 首先在github上下載fpn
    發(fā)表于 10-24 11:08

    浮點數(shù)是如何實現(xiàn)開平方運算

    1位。 ###### 浮點數(shù)的平方根運算步驟為:浮點數(shù)的平方根運算步驟為: 1.從指數(shù)中減去偏置分量,求絕對。 2.將結(jié)果右移一位,然
    發(fā)表于 10-24 08:42

    浮點指令擴展中部分問題的解決與分享

    leg1_ops用于標(biāo)識各種類型的運算指令,而我們由于沒有加上浮點指令,所以在浮點進入后,此處變量leg1_ops為0,導(dǎo)致后續(xù)指令執(zhí)行出錯。 而加上float_op后再進行仿真就會解決此問題 二. 在
    發(fā)表于 10-24 08:14

    浮點舍入模式介紹(六)

    浮點舍入模式 為什么要舍入? 因為單精度浮點數(shù)只取23位尾數(shù)(除去隱藏位),而一些運算不可避免的得到的尾數(shù)會超過23位,因此需要考慮舍入。 根據(jù) IEEE-754 標(biāo)準(zhǔn), 浮點數(shù)
    發(fā)表于 10-24 07:57

    (九)浮點乘法指令設(shè)計

    ⊕ sb,得到結(jié)果的符號位 階碼相加減 按照定點整數(shù)的加減法運算方法對兩個浮點數(shù)的階碼進行加減運算,因為規(guī)格化數(shù)的價碼e滿足1≤e≤254,而ec有可能超出1~254范圍,所以當(dāng)1≤ec≤254,相乘結(jié)果
    發(fā)表于 10-24 07:11

    如何獲取蜂鳥內(nèi)核執(zhí)行模塊浮點指令的運算數(shù)據(jù)

    核中是如何獲取所需的兩個操作數(shù)。 我們以浮點加法運算為例。 首先,經(jīng)過分析我們發(fā)現(xiàn)整型指令寄存器的例化是通過循環(huán)完成的,所以我們可以用相同的方式例化32個32位浮點寄存器,相關(guān)代碼如下: 我們進入例化
    發(fā)表于 10-24 07:10

    浮點運算單元的設(shè)計和優(yōu)化

    浮點運算單元的設(shè)計和優(yōu)化可以從以下幾個方面入手: 1.浮點寄存器設(shè)計:為了實現(xiàn)浮點運算指令子集(RV32F或者RV32D),需要添加一組專用
    發(fā)表于 10-22 07:04

    使用Simulink自動生成浮點運算HDL代碼(Part 1)

    引言 想要實現(xiàn)浮點運算功能,如果自己寫Verilog代碼,需要花費較多的時間和精力。好在Simulink HDL Coder工具箱提供了自動代碼生成技術(shù)。下圖展示了HDL Coder如何生成浮點
    發(fā)表于 10-22 06:48

    risc-v中浮點運算單元的使用及其設(shè)計考慮

    RISC-V浮點運算單元(floating-point unit,簡稱FPU)是一種專門用于執(zhí)行浮點運算的硬件加速器,其作用是提高
    發(fā)表于 10-21 14:46