国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力呢

Dbwd_Imgtec ? 來源:未知 ? 作者:李建兵 ? 2018-03-16 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

問:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?


「速度區別主要是來自于架構上的區別」是一個表面化的解釋。對,架構是不同。但是這種不同是目前各個廠家選擇的現狀,還是由于本質的原因決定的?CPU 能不能增加核?GPU 那張圖為什么不需要 cache?

首先,CPU 能不能像 GPU 那樣去掉 cache?不行。GPU 能去掉 cache 關鍵在于兩個因素:數據的特殊性(高度對齊,pipeline 處理,不符合局部化假設,很少回寫數據)、高速度的總線。對于后一個問題,CPU 受制于落后的數據總線標準,理論上這是可以改觀的。對于前一個問題,從理論上就很難解決。因為 CPU 要提供通用性,就不能限制處理數據的種類。這也是 GPGPU 永遠無法取代 CPU 的原因。

其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面積。其次,CPU 為了維護 cache 的一致性,要增加每個核的復雜度。還有,為了更好的利用 cache 和處理非對齊以及需要大量回寫的數據,CPU 需要復雜的優化(分支預測、out-of-order 執行、以及部分模擬 GPU 的 vectorization 指令和長流水線)。所以一個 CPU 核的復雜度要比 GPU 高的多,進而成本就更高(并不是說蝕刻的成本高,而是復雜度降低了成片率,所以最終成本會高)。所以 CPU 不能像 GPU 那樣增加核。

至于控制能力,GPU 的現狀是差于 CPU,但是并不是本質問題。而像遞歸這樣的控制,并不適合高度對齊和 pipeline 處理的數據,本質上還是數據問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11277

    瀏覽量

    224956
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135433

原文標題:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    CW32F030C8T7是否支持浮點運算

    CW32F030C8T7是否支持浮點運算?如果需要執行復雜的數**算,應該如何處理?
    發表于 12-12 06:51

    為什么FPU在MCU中很重要

    核心去處理其他任務(如控制邏輯、通信、中斷處理),提高了系統的整體響應能力和多任務處理能力。 降低功耗: 由于計算速度大大加快,完成相同計算任務所需的時間顯著縮短,CPU 可以更快地
    發表于 11-18 07:05

    蜂鳥內核模塊浮點指令運算數據的獲取

    核中是如何獲取所需的兩個操作數。 我們以浮點加法運算為例。 首先,經過分析我們發現整型指令寄存器的例化是通過循環完成的,所以我們可以用相同的方式例化32個32位浮點寄存器,相關代碼如下: 我們進入例
    發表于 10-24 13:39

    E203添加浮點數方法:FPU控制邏輯

    。 2. FPU 設計 要實現整一個 FPU 及其控制單元,首先要確定指令周期,以及浮點運算的方式。 由于筆者首次使用 Verilog 設計修改 CPU,因此為了減少錯誤、方便后續修改,筆者將單精度
    發表于 10-24 13:28

    蜂鳥E203的浮點指令集拓展(F拓展)

    關于蜂鳥E203的浮點指令集拓展(F拓展) Whetstone中有很多浮點運算,而蜂鳥e203中沒有硬件支持,是通過將浮點數轉化成整型數來計算,效率大大降低。 為了
    發表于 10-24 11:51

    FPNew開源浮點運算單元工程建立

    在添加浮點運算單元時,可以引用開源的浮點運算器以簡化所需工作任務壓力。在此我們采用了FPnew這個開源工程,再次介紹一些如何將其導成vivado工程。 首先在github上下載fpn
    發表于 10-24 11:08

    浮點數是如何實現開平方運算

    1位。 ###### 浮點數的平方根運算步驟為:浮點數的平方根運算步驟為: 1.從指數中減去偏置分量,求絕對。 2.將結果右移一位,然
    發表于 10-24 08:42

    浮點指令(七:寄存器)

    fcsr寄存器包含浮點異常標志域(fflags),不同的標志位表示不同的異常類型。如果浮點運算單元在運算中出現了相應的異常,則會將fcsr寄存器中對應的標志位設置為1,且會一直保持累積
    發表于 10-24 08:28

    浮點指令擴展中部分問題的解決與分享

    leg1_ops用于標識各種類型的運算指令,而我們由于沒有加上浮點指令,所以在浮點進入后,此處變量leg1_ops為0,導致后續指令執行出錯。 而加上float_op后再進行仿真就會解決此問題 二. 在
    發表于 10-24 08:14

    浮點舍入模式介紹(六)

    浮點舍入模式 為什么要舍入? 因為單精度浮點數只取23位尾數(除去隱藏位),而一些運算不可避免的得到的尾數會超過23位,因此需要考慮舍入。 根據 IEEE-754 標準, 浮點
    發表于 10-24 07:57

    (九)浮點乘法指令設計

    ⊕ sb,得到結果的符號位 階碼相加減 按照定點整數的加減法運算方法對兩個浮點數的階碼進行加減運算,因為規格化數的價碼e滿足1≤e≤254,而ec有可能超出1~254范圍,所以當1≤ec≤254,相乘結果
    發表于 10-24 07:11

    如何獲取蜂鳥內核執行模塊浮點指令的運算數據

    核中是如何獲取所需的兩個操作數。 我們以浮點加法運算為例。 首先,經過分析我們發現整型指令寄存器的例化是通過循環完成的,所以我們可以用相同的方式例化32個32位浮點寄存器,相關代碼如下: 我們進入例化
    發表于 10-24 07:10

    浮點運算單元的設計和優化

    浮點運算單元的設計和優化可以從以下幾個方面入手: 1.浮點寄存器設計:為了實現浮點運算指令子集(RV32F或者RV32D),需要添加一組專用
    發表于 10-22 07:04

    使用Simulink自動生成浮點運算HDL代碼(Part 1)

    引言 想要實現浮點運算功能,如果自己寫Verilog代碼,需要花費較多的時間和精力。好在Simulink HDL Coder工具箱提供了自動代碼生成技術。下圖展示了HDL Coder如何生成浮點
    發表于 10-22 06:48

    risc-v中浮點運算單元的使用及其設計考慮

    RISC-V浮點運算單元(floating-point unit,簡稱FPU)是一種專門用于執行浮點運算的硬件加速器,其作用是提高
    發表于 10-21 14:46