国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

FPGA與GPU類比一下就明白了

Q4MP_gh_c472c21 ? 來源:嵌入式AR ? 2019-12-03 15:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA 是一堆晶體管,你可以把它們連接(wire up)起來做出任何你想要的電路。它就像一個納米級面包板。使用 FPGA 就像芯片流片,但是你只需要買這一張芯片就可以搭建不一樣的設計,作為交換,你需要付出一些效率上的代價。

從字面上講這種說法并不對,因為你并不需要重連(rewire)FPGA,它實際上是一個通過路由網絡(routing network)連接的查找表 2D 網格,以及一些算術單元和內存。FPGA 可以模擬任意電路,但它們實際上只是在模仿,就像軟件電路仿真器模擬電路一樣。這個答案不恰當的地方在于,它過分簡化了人們實際使用 FPGA 的方式。接下來的兩個定義能更好地描述 FPGA。

電路模擬是 FPGA 的經典主流用例,這也是 FPGA 最早出現的原因。FPGA 的關鍵在于硬件設計是用 HDL 形式編碼的,而且買一些便宜的硬件就可以得到和 ASIC 相同的效果。當然,你不可能在 FPGA 和真正的芯片上使用完全相同的 Verilog 代碼,但至少它們的抽象范圍是一樣的。

這是與 ASIC 原型設計不同的一個用例。和電路仿真不同,計算加速是 FPGA 的新興用例。這也是微軟最近成功加速搜索和深度神經網絡的原因。而且關鍵的是,計算實例并不依賴于 FPGA 和真正 ASIC 之間的關系:開發人員針對基于 FPGA 的加速編寫的 Verilog 代碼不需要與用來流片的 Verilog 代碼有任何的相似性。

這兩種實例在編程、編譯器和抽象方面存在巨大差異。我比較關注后者,我將其稱為「計算 FPGA 編程」(computaTIonal FPGA programming)。我的論點是,目前計算 FPGA 的編程方法都借鑒了傳統的電路仿真編程模型,這是不對的。如果你想開發 ASIC 原型的話,Verilog 和 VHDL 都是正確的選擇。但如果目標是計算的話,我們可以也應該重新思考整個堆棧。
讓我們開門見山地說吧。FPGA 是一類很特殊的硬件,它用來高效執行模擬電路描述的特殊軟件。FPGA 配置需要一些底層軟件——它是為了 ISA 編寫的程序。 這里可以用 GPU 做類比。 在深度學習區塊鏈盛行之前,有一段時間 GPU 是用來處理圖形的。在 21 世紀初,人們意識到他們在處理沒有圖形數據的計算密集型任務時,也會大量使用 GPU 作為加速器:GPU 設計師們已經構建了更通用的機器,3D 渲染只是其中一個應用而已。
FPGA的定義以及和GPU的類比
計算 FPGA 遵循了相同的軌跡。我們的想法是要多多使用這一時興的硬件,當然不是為了電路仿真,而是利用適合電路執行的計算模式,用類比的形式來看 GPU 和 FPGA。
為了讓 GPU 發展成今天的數據并行加速器,人們不得不重新定義 GPU 輸入的概念。我們過去常常認為 GPU 接受奇特的、強烈的、特定領域的視覺效果描述。我們實現了 GPU 執行程序,從而解鎖了它們真正的潛力。這樣的實現讓 GPU 的目標從單個應用域發展為整個計算域。 我認為計算 FPGA 正處于類似的轉變中,現在還沒有針對 FPGA 擅長的基本計算模式的簡潔描述。但它和潛在的不規則并行性、數據重用以及大多數靜態的數據流有關。 和 GPU 一樣,FPGA 也需要能夠體現這種計算模式的硬件抽象,Verilog 用于計算 FPGA 的問題在于它在低級硬件抽象中效果不好,在高級編程抽象中的效果也不好。讓我們通過反證法想象一下,如果用 RTL(寄存器傳輸級)取代這些角色會是什么樣。 甚至 RTL 專家可能也無法相信 Verilog 是可以高效開發主流 FPGA 的方式。它不會把編程邏輯推向主流。對于經驗豐富的硬件黑客來說,RTL 設計似乎是友好而熟悉的,但它與軟件語言之間的生產力差距是不可估量的。
事實上,對現在的計算 FPGA 來說,Verilog 實際上就是 ISA。主要的 FPGA 供應商工具鏈會將 Verilog 作為輸入,而高級語言的編譯器則將 Verilog 作為輸出。供應商一般會對比特流格式保密,因此 Verilog 在抽象層次結構中會處于盡可能低的位置。
把 Verilog 當做 ISA 的問題是它和硬件之間的距離太遠了。RTL 和 FPGA 硬件之間的抽象差距是巨大的,從傳統角度講它至少要包含合成、技術映射以及布局布線——每一個都是復雜而緩慢的過程。因此,FPGA 上 RTL 編程的編譯/編輯/運行周期需要數小時或數天,更糟糕的是,這是一個無法預測的過程,工具鏈的深層堆??赡軙谏w RTL 中的改變,這可能會影響設計性能和能源特性。
好的 ISA 應該直接展示底層硬件未經修飾的真實情況。像匯編語言一樣,它其實不需要很方便編程。但也像匯編語言一樣,它的編譯速度需要非???,而且結果可預測。如果想要構建更高級的抽象和編譯器,就需要一個不會出現意外的低級目標。而 RTL 不是這樣的目標。
如果計算 FPGA 是特定類算法模式的加速器,那當前的 FPGA 并不能理想地實現這一目標。在這個游戲規則下能夠擊敗 FPGA 的新硬件類型,才可能帶來全新的抽象層次結構。新的軟件棧應該摒棄 FPGA 在電路仿真方面的遺留問題,以及 RTL 抽象。
-END-

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22412

    瀏覽量

    636303
  • 晶體管
    +關注

    關注

    78

    文章

    10396

    瀏覽量

    147750
  • 編譯器
    +關注

    關注

    1

    文章

    1672

    瀏覽量

    51606

原文標題:FPGA難懂?與GPU類比一下就明白了

文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FPGA+GPU異構混合部署方案設計

    為滿足對 “納秒級實時響應” 與 “復雜數據深度運算” 的雙重需求,“FPGA+GPU”異構混合部署方案通過硬件功能精準拆分與高速協同,突破單硬件的性能瓶頸 ——FPGA聚焦低延遲實時交易鏈路,
    的頭像 發表于 01-13 15:20 ?349次閱讀

    咨詢一下工業設計中批量生產FPGA時,程序是如何批量下載

    是否成功,自動掃描待燒寫的程序,并顯示燒寫程序是否成功等信息。這樣來,即使是外行人也能夠輕松實現批量燒寫程序。 在此,想咨詢一下目前業內針對批量燒寫 FPGA 程序都有哪些成熟的方案?這些方案各自具有怎樣的特點和適用場景?
    發表于 12-24 22:40

    【雷達模組】久坐提醒設備,“起來走動一下

    。之前申請的Rd-03 _ V2剛好滿足,所以就通過Rd-03 _ V2實現感知人體存在。 由于主要考慮PC提醒所以這次上位機沒有使用單片機,而是使用 USB轉串口連接Rd-03 _ V2,使用上報模式來實現較為細致的行為檢測。 之前做的都是方方正正的,這次想著美化一下。弄
    的頭像 發表于 12-16 09:20 ?381次閱讀
    【雷達模組】久坐提醒設備,“起來走動<b class='flag-5'>一下</b>”

    支付寶“碰一下”的革新背后:國民技術MCU的隱形力量

    近日,全球頂尖金融科技盛會Money20/20公布首屆創新大獎TheMoneyAwards結果,“支付寶碰一下”從眾多參賽企業中脫穎而出,憑借創新的解決方案和極致的用戶體驗摘得“支付”類別大獎,成為
    的頭像 發表于 11-21 19:15 ?1339次閱讀
    支付寶“碰<b class='flag-5'>一下</b>”的革新背后:國民技術MCU的隱形力量

    瑞蘇盈科:FPGA領域的創新者,以技術實力賦能FPGA設計服務和解決方案

    我們今天,小編向大家詳細的介紹一下——瑞蘇盈科,FPGA界的寶藏選手,您想了解的全在這里!
    的頭像 發表于 11-21 08:32 ?442次閱讀
    瑞蘇盈科:<b class='flag-5'>FPGA</b>領域的創新者,以技術實力賦能<b class='flag-5'>FPGA</b>設計服務和解決方案

    如何看懂GPU架構?分鐘帶你了解GPU參數指標

    分析GPU核心參數體系:算力、顯存大小、顯存帶寬、熱門架構特性等關鍵指標,旨在幫您理解不同應用場景,如何選擇最合適的GPU算力解決方案。1、算力GPU執行浮點運算
    的頭像 發表于 10-09 09:28 ?1134次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構?<b class='flag-5'>一</b>分鐘帶你了解<b class='flag-5'>GPU</b>參數指標

    奧比中光助力支付寶碰一下落地電梯場景

    近日,支付寶與分眾傳媒宣布聯合推出“碰一下搶紅包”服務。作為創新交互方式,“支付寶碰一下”首次被引入至電梯場景,并已在全國20余個城市的電梯鋪設。奧比中光作為“支付寶碰一下”業務的核心供應商,為這
    的頭像 發表于 08-12 11:32 ?1227次閱讀

    AI狂飆, FPGA會掉隊嗎? ()

    ;新工藝新接口:視頻接口,測試測量等。有那么多的機會,FPGA怎么不上天呢?其實FPGA真上天,在每臺火星車上,幾乎都有宇航級FPGA
    的頭像 發表于 08-11 09:25 ?3906次閱讀
    AI狂飆, <b class='flag-5'>FPGA</b>會掉隊嗎? (<b class='flag-5'>下</b>)

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經安裝了cuda和cudnn,在全局的py里添加了torch,能夠調用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發表于 07-25 08:18

    “碰一下”支付終端應用在酒店:智能無卡入住與客房控制

    “碰一下”支付終端和“碰一下”支付機具今年已在各種餐飲零售門店推廣應用。就連天波小編家附近的村口小超市也用上了“碰一下”支付終端。近日,鹵味龍頭企業絕味食品宣布,全國門店將接入“支付寶碰一下
    的頭像 發表于 07-04 09:57 ?826次閱讀
    “碰<b class='flag-5'>一下</b>”支付終端應用在酒店:智能無卡入住與客房控制

    類比半導體推出全新第二代高邊開關芯片HD80012

    致力于提供高品質汽車驅動芯片和高品質工業模擬芯片供應商上海類比半導體技術有限公司(稱“類比半導體”或“類比”)宣布推出全新第二代高邊開關芯片HD80012,單通道低內阻1.2mΩ產品
    的頭像 發表于 07-02 15:19 ?1316次閱讀
    <b class='flag-5'>類比</b>半導體推出全新第二代高邊開關芯片HD80012

    一下終端,讓自助售貨機秒變 “家里的冰箱”

    繼刷臉支付后,支付寶近日又推出了新的支付方式——碰一下支付。只需將手機輕輕靠近支付寶“碰一下”支付終端,即可完成支付,比以往要先解鎖手機,調出APP的付款碼再支付的操作環節要便捷和省時許多?!芭?b class='flag-5'>一下
    的頭像 發表于 06-18 10:49 ?1785次閱讀
    碰<b class='flag-5'>一下</b>終端,讓自助售貨機秒變 “家里的冰箱”

    類比半導體推出全新第二代高邊開關芯片HD8004

    致力于提供高品質汽車驅動芯片和高品質工業模擬芯片供應商上海類比半導體技術有限公司(稱“類比半導體”或“類比”)宣布推出全新第二代高邊開關芯片HD8004,單通道低內阻4.3mΩ產品。
    的頭像 發表于 05-21 18:04 ?1341次閱讀
    <b class='flag-5'>類比</b>半導體推出全新第二代高邊開關芯片HD8004

    可以手動構建imx-gpu-viv嗎?

    在 debian 10 上使用 imx gpu 交叉編譯 Qt,以便它與我的應用程序起工作。但是 imx-gpu-viv-6.4.3.p4.2.aarch64.bin(libGAL.so、libEGL.so
    發表于 03-28 06:35

    個過零檢測電路,但有部分電路沒看明白,有大神可以詳細解釋一下

    個過零檢測電路,但是沒明白粉色框部分有什么作用,有大神可以詳細解釋一下
    發表于 03-20 00:40