国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么FPGA主頻比CPU慢,但卻可以用來幫CPU做加速

電子工程師 ? 來源:FPGA技術江湖 ? 作者:EDN電子技術設計 ? 2020-11-20 09:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們知道,FPGA的頻率一般只有幾百MHz,而CPU的頻率卻高達數GHz。那么,有不少網友心中就有一個疑問:“為什么FPGA主頻比CPU慢,但卻可以用來幫CPU做加速?”。

今天,EDN就和大家系統性地討論下這個問題。

將FPGA主頻與CPU相比不妥

在開始之前,首先要明確一點,將FPGA的主頻與CPU比較,實際是風馬牛不相及的問題。FPGA和CPU是兩種完全不同的器件,前者是專用,是硬件編程,而后者是通用,是軟件編程。

不同體系結構性能和靈活性的比較。(圖片來源:《如何評價微軟在數據中心使用 FPGA 代替傳統 CPU 的做法?》)

表面上看,FPGA的時鐘頻率要低;對于通用計算任務,FPGA設計貌似不如CPU設計。但是實際上,單個FPGA的并行度卻比CPU要高得多。FPGA的行為是確定性的,用作硬件加速器沒有時間片、線程或資源沖突的問題。它始終以完全相同的速度執行一件事。因此,如果需要低延遲,那么FPGA就可能是最佳選擇。

計算密集型任務,CPU、GPU、FPGA、ASIC 的數量級比較(以16位整數乘法為例,數字僅為數量級的估計)(圖片來源:《如何評價微軟在數據中心使用 FPGA 代替傳統 CPU 的做法?》)

FPGA并行計算機制

如知乎網友young cc所言,雖然CPU主頻很高,但其是通用處理器,做某個特定運算(如信號處理,圖像處理)可能需要很多個時鐘周期。而FPGA可以通過編程重組電路,直接生成專用電路。加上電路并行性,可能做這個特定運算只需要一個時鐘周期。

舉例來說,CPU主頻為3GHz,FPGA主頻為200MHz。若做某個特定運算,CPU需要30個時鐘周期,而FPGA只需一個,那么耗時情況是:

CPU:30/3GHz =10ns;

FPGA:1/200MHz =5ns。

可以看到,FPGA做這個特定運算速度比CPU快,能幫助加速。

另外,CPU的主頻是加過流水線之后的。比如是15級流水線,則第一條指令執行了15個時鐘周期后才能出結果。

但是,使用FPGA也不一定總能做加速。

例如,知乎網友Evan172就表示,使用FPGA做加速,只是在某些強計算和數據處理的方面,因為其硬件電路并行運行和有很多DSP硬核資源供調用的特點,可以工作得更出色。

FPGA本身也只是輔助角色,做控制的還是CPU本身,所以FPGA并不能代替CPU,只是在完成一件大任務的過程中將某部分任務分解給FPGA可以更好地一起完成任務。在這過程中也會有額外的開銷產生,在某些場合,可能用了FPGA而效果更差也是有的。

另外,通常說的使用FPGA加速比CPU和GPU省電,是指在完成同樣的任務下,FPGA耗費的電力比起CPU和GPU更少一些。這是相對而言的,并不是說FPGA本身就一定省電。

一個有趣的例子:數組加法計算

知乎用戶doing舉了一個很有趣的例子。他指出,假設用FPGA完整實現了CPU,然后再跑軟件的話,的確比CPU慢。問題是FPGA不會那么干,它會直指問題本質,解決問題。

例如,有兩個數組,其中有256個32位數?,F在要把它們對應相加變成一個數組,用CPU寫最快大概是這個樣子:

r[0] = a[0] + b[0];

r[1] = a[1] + b[1];

...

r[255] = a[255] + b[255];

當然也可能會這么寫(在分支預測準確,指令緩存不大的情況下可能更快):

for (int i = 0; i < 255; i++)

r[i] = a[i] + b[i];

對FPGA來說,也可以用上面相同的寫法,不同在于:

CPU是一個一個加法計算,而FPGA排好邏輯電路,在一個時鐘周期內計算完畢。就算CPU主頻比FPGA快100倍也趕不上啊。話說后來CPU大量的增加SIMD指令,就有點這個意思,不過這相當于提供庫函數,沒那么靈活。

FPGA并行是真并行,CPU完全沒得比。CPU如果想并行最多也就是讓多個核并行,但是對于大部分算法實現來說,如上例,多個核之間的同步調度開銷遠遠大于計算開銷,就算多個核之間的調用開銷可以做的很小,一般CPU也就那幾個核,而FPGA只要門足夠,想并行幾路就可以并行幾路。

所以在做可并行的計算密集型任務時,比如信號處理,網絡傳輸等等FPGA可以幫上忙;但是如果做常見的以串行為主的任務,FPGA的確遠遠比不上CPU。如果要類比的話,有點像似GPU和CPU之間的關系。

“當年寫Verilog的時候,我就想如果CPU里面自帶一塊FPGA,應用程序程序可以在初始化期間直接燒一段代碼下去,那豈不是很爽。后來,有了能寫shader的3D顯卡...”

為什么FPGA成為數據中心尖端技術?

最后再討論一個話題,就是為什么FPGA一直是數據中心領域最尖端的技術?

有人可能認為,再大的問題(算力)都可以通過堆CPU核心來解決。那么,假設有一臺強大的48核服務器,即使使用非常高端的FPGA,也很難達到相同的吞吐量。而且,FPGA硬件設計還需要由強大的團隊來完成,非常燒錢。

這時,如果把機會成本和能源效率兩者考慮進去,好處就開始顯現出來了。

首先來看能源效率。假設這臺48核服務器的功耗為400W并且發熱嚴重,那么就會對數據中心運營不利——能耗和散熱是數據中心運營的兩項最大支出。而將FPGA連接起來只執行一項任務,就可以實現很高的能效而開銷極低。通過正確的設計,可以在實現低功耗的同時獲得高吞吐量。

其次,機會成本(這個問題不太明顯)。系統中的CPU內核數量就那么多。購買新的內核并且安裝需要花很長時間,而且最好是將通用CPU內核保留用于通用任務(例如虛擬機訂閱)。每個CPU核賣不出去就會燒錢。

當有任務大量占用CPU時間(例如AI推理)時,FPGA就成為了不錯的選擇。

一個有關微軟Project Catapult項目當中FPGA的趣事

當年,微軟必應團隊在其Project Catapult項目中發現,在啟用FPGA時,CPU的總體利用率實際上略有上升。所有的人都感到困惑,因為從直覺來看FPGA應該要減少CPU負載。但是后來他們發現,數據中心的業務流量達到了原來的2倍!由于效率提高,流量實現了兩倍的負載均衡。由此可見FPGA的強大之處。

結語

維基百科的相關詞條提到兩點:FPGA的優勢在于其并行特性,有時對于某些應用而言可以使速度明顯變快;可以使用FPGA來對算法中的某些部分加速,也可以在FPGA和通用處理器之間共享部分計算。

綜上,FPGA有兩個優點:FPGA并行度遠超CPU;CPU是通用電路,FPGA是定制電路。但是也有兩個缺點:開發周期長;并不是所有東西都適合FPGA。

責任編輯:xj

原文標題:為什么FPGA主頻比CPU慢,卻可以幫其加速?

文章出處:【微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22408

    瀏覽量

    636245
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11277

    瀏覽量

    224954
  • 主頻
    +關注

    關注

    1

    文章

    22

    瀏覽量

    9335

原文標題:為什么FPGA主頻比CPU慢,卻可以幫其加速?

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DIY電腦小白必看:CPU涂導熱硅脂教程與注意事項

    在組裝或升級電腦時,很多人會把注意力放在CPU、散熱器、主板等核心硬件上,卻忽略了連接它們之間的一個關鍵環節——導熱硅脂。雖然它只是一層薄薄的“膏體”,但卻直接影響CPU的散熱效率和系統穩定性。導熱
    的頭像 發表于 02-05 17:07 ?503次閱讀
    DIY電腦小白必看:<b class='flag-5'>CPU</b>涂導熱硅脂教程與注意事項

    MangoTree新品劇透:全新PXI形態+最強CPU #PXI #PXIe #測控 #CPU

    cpu
    芒果樹數字
    發布于 :2026年01月30日 11:36:11

    那么龍芯CPU性能如何呢?

    龍芯系列CPU的最新動態 以下是龍芯系列CPU的最新動態(截至2025年10月): 龍芯CPU的性能如何? 以下是龍芯CPU性能的詳細分析,結合最新產品與技術動態: 一、桌面處理器性能
    的頭像 發表于 12-03 13:42 ?1014次閱讀

    CPU 到 GPU,渲染技術如何重塑游戲、影視與設計?

    渲染技術是計算機圖形學的核心內容之一,它是將三維場景轉換為二維圖像的過程。渲染技術一直在不斷演進,從最初的CPU渲染到后來的GPU渲染,性能和質量都有了顯著提升。從CPU到GPU:技術特點和優缺點
    的頭像 發表于 09-01 12:16 ?980次閱讀
    從 <b class='flag-5'>CPU</b> 到 GPU,渲染技術如何重塑游戲、影視與設計?

    開源的e203rtl 可以FPGA板子(DDRt)跑50M主頻嗎?

    開源的e203rtl 可以FPGA板子(DDRt)跑50M主頻嗎? 跑25M時,可以通過spi打印出來數數據,但是跑50M主頻時候,看似下
    發表于 07-11 07:58

    單核CPU網關和雙核CPU網關有什么區別

    單核CPU網關與雙核CPU網關的核心區別在于處理能力、多任務效率、性能表現及適用場景,雙核CPU網關在多任務處理、復雜計算和響應速度上具有顯著優勢,而單核CPU網關則更適合輕量級、低負
    的頭像 發表于 07-05 14:37 ?1060次閱讀

    主控CPU全能選手,英特爾至強6助力AI系統高效運轉

    有什么特殊之處呢? AI加速系統為何看重CPU主控能力? 作為造價極高的AI加速系統,DGX B300可以不計成本地選任何CPU,只要它能充
    的頭像 發表于 06-27 11:44 ?878次閱讀
    主控<b class='flag-5'>CPU</b>全能選手,英特爾至強6助力AI系統高效運轉

    一片主板可以有多少路CPU?

    CPU是計算機的中央處理器,可以直接影響到服務器的并行處理能力。CPU路數越多,服務器可以同時處理的任務數量就越多,從而提高了整體的處理效率和性能,特別是在處理大量并發任務時,多路服務
    的頭像 發表于 06-13 09:14 ?719次閱讀
    一片主板<b class='flag-5'>可以</b>有多少路<b class='flag-5'>CPU</b>?

    CPU Socket的基本結構和工作原理

    CPU Socket是連接中央處理單元(CPU)與計算機主板之間的關鍵部件,它充當著傳遞電信號、電源和散熱等多重功能的樞紐。在整個計算機系統中,CPU Socket的作用至關重要,尤其在高性能計算
    的頭像 發表于 05-08 17:14 ?2426次閱讀

    在KiCad的PCB編輯其中,有一個實用的工具,可以用來清理布線與過孔

    在KiCad的PCB編輯其中,有一個實用的工具,可以用來清理布線與過孔。不僅可以移除沒有使用的布線與過孔,還可以清理冗余的重疊導線。
    發表于 05-06 21:57

    國產電腦CPU性能排行榜TOP7:CPU緩存/主頻/多核實測數據分析

    在科技飛速發展的今天,電腦CPU(中央處理器)無疑是計算機性能的核心部件。而長久以來,國際品牌在這一領域占據著主導地位,給人一種國產CPU性能不行的刻板印象。然而,隨著技術的不斷進步和研發投入的加大,國產電腦CPU性能已經取得了
    的頭像 發表于 04-29 10:38 ?3352次閱讀
    國產電腦<b class='flag-5'>CPU</b>性能排行榜TOP7:<b class='flag-5'>CPU</b>緩存/<b class='flag-5'>主頻</b>/多核實測數據分析

    信創國產CPU推薦

    cpu
    jf_10805031
    發布于 :2025年04月23日 17:20:43

    CPU的各種指令和執行流程

    在集成電路設計中,CPU的指令是指計算機中央處理單元(CPU用來執行計算任務的基本操作指令集。這些指令是CPU能夠理解并執行的二進制代碼,它們在計算機內部由硬件控制并按順序執行,從而
    的頭像 發表于 04-18 11:24 ?2617次閱讀

    【國產信創CPU全攻略】分享國產CPU品牌排行榜!從排名到避坑!

    最近收到不少粉絲留言:“想換國產電腦,但國產CPU品牌太多,完全不知道怎么選!”“信創CPU排名到底靠不靠譜?”今天咱們就來嘮嘮這個話題——國產CPU品牌有哪些?信創CPU怎么挑?附上
    的頭像 發表于 04-14 14:34 ?5474次閱讀
    【國產信創<b class='flag-5'>CPU</b>全攻略】分享國產<b class='flag-5'>CPU</b>品牌排行榜!從排名到避坑!

    請問為什么模型加載時間CPU長?

    為什么模型加載時間 CPU 長?
    發表于 03-06 06:03