FPGA > GPU > CPU,產生這樣結果的根本原因:對于計算密集型算法,數據的搬移和運算效率越高的能耗比就越高。ASIC和FPGA都是更接近底層IO,所以計算效率高和數據搬移高,但是FPGA有冗余晶體管和連線,運行頻率低,所以沒有ASIC能耗比高。GPU和CPU都是屬于通用處理器,都需要進行取指令、指令譯碼、指令執行的過程,通過這種方式屏蔽了底層IO的處理,使得軟硬件解耦,但帶來數據的搬移和運算無法達到更高效率,所以沒有ASIC、FPGA能耗比高。GPU和CPU之間的能耗比的差距,主要在于CPU中晶體管有大部分用在cache和控制邏輯單元,所以CPU相比GPU來說,對于計算密集同時計算復雜度低的算法,有冗余的晶體管無法發揮作用,能耗比上CPU低于GPU。" />

国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU將失寵,ASIC 才是AI 前景所在

M8kW_icbank ? 來源:未知 ? 作者:伍文輝 ? 2018-01-02 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPU人工智能AI)運算大放異彩,激勵兩家GPU 大廠Nvidia、超微(AMD)股價狂飆。但是分析師警告,明年GPU 在AI 的地位,也許會遭「特殊應用集成電路」(ASIC)取代。

12 日Nvidia 下跌1.96%,13 日續跌2.44% 收在186.18 美元。12 日超微下跌2.56%,13 日反彈2.12% 收在10.11 美元。

MarketWatch、Smarter Analyst報導,Susquehanna分析師Christopher Rolland 12日報告稱,2017年AI GPU當道,2018年可能換成ASIC發威。AI運用深度學習解決真實世界問題,也使用在語音和影像辨識、自動駕駛、醫療等,Nvidia是AI工作量大增的受惠者,股價暴沖。不過,Susquehanna和多位業界領袖討論,判斷ASIC可能會取代GPU。

Rolland 以虛擬貨幣挖礦為例,解釋此一變化。早期礦工挖掘虛幣時,多用GPU,不過隨著挖礦難度不斷提高,礦工逐漸改用ASIC。現在比特幣礦工多半采用ASIC,以太幣礦工也會在今年改用ASIC。市面上更出現以太幣專用ASIC,效能遠勝GPU。

報告稱,Nvidia 有ASIC 相關部門,未來仍會在AI 扮演重要角色。但是市場將有更多競爭者,有望受惠的ASIC 業者,包括協助谷歌研發AI 芯片的博通、Cavium、Marvell、Microsemi 等。

另外,現場可程式化閘陣列(Field-Programmable Gate Array,FPGA)也可能從AI 熱潮沾光,賽靈思(Xilinx)的FPGA 就用于亞馬遜云端服務。

芯片商Cerebras 正在研發AI 專用的ASIC,該公司執行長Andrew Feldman 強調,GPU 并非最適合AI 運算的芯片。GPU 原本是為了電玩開發,如今卻碰巧適用于另一個毫不相干的新市場。這種幸運的巧合不會發生,最可能的解釋是,GPU 只是當前最佳的解決方案,讓業界能繼續往前,暗示ASIC 才是AI 前景所在。

Barron's.com 8 月23 日報導,摩根士丹利(Morgan Stanley,通稱大摩)發表研究報告指出,現場可程式化閘陣列在機器學習進行「推論」(inference)時扮演的角色,可能比市場想像還要大,Xilinx 有望受惠。

GPU、FPGA、ASIC,誰更適合人工智能?

圍繞著人工智能的計算,有上述三種方案,我們來看一下哪一種會是AI首選。

GPU主要擅長做類似圖像處理的并行計算,所謂的“粗粒度并行(coarse-grain parallelism)”。圖形處理計算的特征表現為高密度的計算而計算需要的數據之間較少存在相關性,GPU 提供大量的計算單元(多達幾千個計算單元)和大量的高速內存,可以同時對很多像素進行并行處理。

GPU中一個邏輯控制單元對應多個計算單元,同時要想計算單元充分并行起來,邏輯控制必然不會太復雜,太復雜的邏輯控制無法發揮計算單元的并行度,例如過多的if…else if…else if… 分支計算就無法提高計算單元的并行度,所以在GPU中邏輯控制單元也就不需要能夠快速處理復雜控制。

這里GPU計算能力用Nvidia的Tesla K40進行分析,K40包含2880個流處理器(Stream Processor),流處理器就是GPU的計算單元。每個流處理器包含一個32bit單精度浮點乘和加單元,即每個時鐘周期可以做2個單精度浮點計算。GPU峰值浮點計算性能 = 流處理器個數 GPU頻率 每周期執行的浮點操作數。以K40為例,K40峰值浮點計算性能= 2880(流處理器) 745MHz 2(乘和加) = 4.29T FLOPs/s即每秒4.29T峰值浮點計算能力。

GPU芯片結構是否可以充分發揮浮點計算能力?GPU同CPU一樣也是指令執行過程:取指令 ->指令譯碼 ->指令執行,只有在指令執行的時候,計算單元才發揮作用。GPU的邏輯控制單元相比CPU簡單,所以要想做到指令流水處理,提高指令執行效率,必然要求處理的算法本身復雜度低,處理的數據之間相互獨立,所以算法本身的串行處理會導致GPU浮點計算能力的顯著降低。

上圖是GPU的設計結構。GPU的設計出發點在于GPU更適用于計算強度高、多并行的計算。因此,GPU把晶體管更多用于計算單元,而不像CPU用于數據Cache和流程控制器。這樣的設計是因為并行計算時每個數據單元執行相同程序,不需要繁瑣的流程控制而更需要高計算能力,因此也不需要大的cache容量。

FPGA作為一種高性能、低功耗的可編程芯片,可以根據客戶定制來做針對性的算法設計。所以在處理海量數據的時候,FPGA 相比于CPU 和GPU,優勢在于:FPGA計算效率更高,FPGA更接近IO。

FPGA不采用指令和軟件,是軟硬件合一的器件。對FPGA進行編程要使用硬件描述語言,硬件描述語言描述的邏輯可以直接被編譯為晶體管電路的組合。所以FPGA實際上直接用晶體管電路實現用戶的算法,沒有通過指令系統的翻譯。

FPGA的英文縮寫名翻譯過來,全稱是現場可編程邏輯門陣列,這個名稱已經揭示了FPGA的功能,它就是一堆邏輯門電路的組合,可以編程,還可以重復編程。上圖展示了可編程FPGA的內部原理圖。

里FPGA計算能力用Xilinx的V7-690T進行分析,V7-690T包含3600個DSP(Digital Signal Processing),DSP就是FPGA的計算單元。每個DSP可以在每個時鐘周期可以做2個單精度浮點計算(乘和加)。FPGA峰值浮點計算性能 = DSP個數 FPGA頻率 每周期執行的浮點操作數。V7-690T運行頻率已250MHz來計算,V7-690T峰值浮點計算性能 = 3600(DSP個數) 250MHz 2(乘和加)=1.8T FLOPs/s即每秒1.8T峰值浮點計算能力。

FPGA芯片結構是否可以充分發揮浮點計算能力?FPGA由于算法是定制的,所以沒有CPU和GPU的取指令和指令譯碼過程,數據流直接根據定制的算法進行固定操作,計算單元在每個時鐘周期上都可以執行,所以可以充分發揮浮點計算能力,計算效率高于CPU和GPU。

ASIC是一種專用芯片,與傳統的通用芯片有一定的差異。是為了某種特定的需求而專門定制的芯片。ASIC芯片的計算能力和計算效率都可以根據算法需要進行定制,所以ASIC與通用芯片相比,具有以下幾個方面的優越性:體積小、功耗低、計算性能高、計算效率高、芯片出貨量越大成本越低。但是缺點也很明顯:算法是固定的,一旦算法變化就可能無法使用。目前人工智能屬于大爆發時期,大量的算法不斷涌出,遠沒有到算法平穩期,ASIC專用芯片如何做到適應各種算法是個最大的問題,如果以目前CPU和GPU架構來適應各種算法,那ASIC專用芯片就變成了同CPU、GPU一樣的通用芯片,在性能和功耗上就沒有優勢了。

我們來看看FPGA 和 ASIC 的區別。FPGA基本原理是在芯片內集成大量的數字電路基本門電路以及存儲器,而用戶可以通過燒入 FPGA 配置文件來來定義這些門電路以及存儲器之間的連線。這種燒入不是一次性的,即用戶今天可以把 FPGA 配置成一個微控制器 MCU,明天可以編輯配置文件把同一個 FPGA 配置成一個音頻編解碼器。ASIC 則是專用集成電路,一旦設計制造完成后電路就固定了,無法再改變。

比較 FPGA 和 ASIC 就像比較樂高積木和模型。舉例來說,如果你發現最近星球大戰里面 Yoda 大師很火,想要做一個 Yoda 大師的玩具賣,你要怎么辦呢?

有兩種辦法,一種是用樂高積木搭,還有一種是找工廠開模定制。用樂高積木搭的話,只要設計完玩具外形后去買一套樂高積木即可。而找工廠開模的話在設計完玩具外形外你還需要做很多事情,比如玩具的材質是否會散發氣味,玩具在高溫下是否會融化等等,所以用樂高積木來做玩具需要的前期工作比起找工廠開模制作來說要少得多,從設計完成到能夠上市所需要的時間用樂高也要快很多。

FPGA 和 ASIC 也是一樣,使用 FPGA 只要寫完 Verilog 代碼就可以用 FPGA 廠商提供的工具實現硬件加速器了,而要設計 ASIC 則還需要做很多驗證和物理設計 (ESD,Package 等等),需要更多的時間。如果要針對特殊場合(如軍事和工業等對于可靠性要求很高的應用),ASIC 則需要更多時間進行特別設計以滿足需求,但是用 FPGA 的話可以直接買軍工級的高穩定性 FPGA 完全不影響開發時間。但是,雖然設計時間比較短,但是樂高積木做出來的玩具比起工廠定制的玩具要粗糙(性能差)一些(下圖),畢竟工廠開模是量身定制。

另外,如果出貨量大的話,工廠大規模生產玩具的成本會比用樂高積木做便宜許多。FPGA 和 ASIC 也是如此,在同一時間點上用最好的工藝實現的 ASIC 的加速器的速度會比用同樣工藝 FPGA 做的加速器速度快 5-10 倍,而且一旦量產后 ASIC 的成本會遠遠低于 FPGA 方案。

FPGA 上市速度快, ASIC 上市速度慢,需要大量時間開發,而且一次性成本(光刻掩模制作成本)遠高于 FPGA,但是性能高于 FPGA 且量產后平均成本低于 FPGA。目標市場方面,FPGA 成本較高,所以適合對價格不是很敏感的地方,比如企業應用,軍事和工業電子等等(在這些領域可重配置真的需要)。而 ASIC 由于低成本則適合消費電子類應用,而且在消費電子中可配置是否是一個偽需求還有待商榷。

我們看到的市場現狀也是如此:使用 FPGA 做深度學習加速的多是企業用戶,百度、微軟、IBM 等公司都有專門做 FPGA 的團隊為服務器加速,而做 FPGA 方案的初創公司 Teradeep 的目標市場也是服務器。而 ASIC 則主要瞄準消費電子,如 Movidius。由于移動終端屬于消費電子領域,所以未來使用的方案應當是以 ASIC 為主。

由于不同的芯片生產工藝,對芯片的功耗和性能都有影響,這里用相同工藝或者接近工藝下進行對比,ASIC芯片還沒有商用的芯片出現,Google的TPU也只是自己使用沒有對外提供信息,這里ASIC芯片用在學術論文發表的《DianNao: A Small-Footprint High-Throughput Accelerator for Ubiquitous Machine-Learning》作為代表。

GPU將失寵,ASIC 才是AI 前景所在

從上面的對比來看,能耗比方面:ASIC > FPGA > GPU > CPU,產生這樣結果的根本原因:對于計算密集型算法,數據的搬移和運算效率越高的能耗比就越高。ASIC和FPGA都是更接近底層IO,所以計算效率高和數據搬移高,但是FPGA有冗余晶體管和連線,運行頻率低,所以沒有ASIC能耗比高。GPU和CPU都是屬于通用處理器,都需要進行取指令、指令譯碼、指令執行的過程,通過這種方式屏蔽了底層IO的處理,使得軟硬件解耦,但帶來數據的搬移和運算無法達到更高效率,所以沒有ASIC、FPGA能耗比高。GPU和CPU之間的能耗比的差距,主要在于CPU中晶體管有大部分用在cache和控制邏輯單元,所以CPU相比GPU來說,對于計算密集同時計算復雜度低的算法,有冗余的晶體管無法發揮作用,能耗比上CPU低于GPU。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22412

    瀏覽量

    636359
  • asic
    +關注

    關注

    34

    文章

    1274

    瀏覽量

    124595
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135467
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301443

原文標題:GPU將失寵,明年的AI市場看ASIC

文章出處:【微信號:icbank,微信公眾號:icbank】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI ASIC:博通份額達60%,聯發科成長顯著,臺積電成最大贏家

    Counterpoint指出,AI芯片熱潮進入第二階段,ASICGPU競爭激烈,博通和臺積電有望成最大贏家。 ? Counterpoint預測,AI
    的頭像 發表于 02-05 18:21 ?1.3w次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>ASIC</b>:博通份額<b class='flag-5'>將</b>達60%,聯發科成長顯著,臺積電成最大贏家

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    、汽車)。 未來,隨著AI應用的深化,硬件分工更精細——可能出現專為機器人設計的專用AI芯片,或融合NPU與GPU優勢的“邊緣訓練芯片”。但無論如何,“匹配場景
    的頭像 發表于 12-17 17:13 ?1750次閱讀
    <b class='flag-5'>AI</b>硬件全景解析:CPU、<b class='flag-5'>GPU</b>、NPU、TPU的差異化之路,一文看懂!?

    AI芯片市場鏖戰,GPUASIC誰將占據主動?

    本文轉自:TechSugar隨著人工智能技術在大模型訓練、邊緣計算、自動駕駛等領域的深度滲透,核心算力硬件的競爭進入白熱化階段。圖形處理單元(GPU)與專用集成電路(ASIC)作為兩大主流技術路線
    的頭像 發表于 10-30 12:06 ?770次閱讀
    <b class='flag-5'>AI</b>芯片市場鏖戰,<b class='flag-5'>GPU</b>與<b class='flag-5'>ASIC</b>誰將占據主動?

    科技云報到:找到真場景,抓住真需求,這樣的具身智能才是AI

    科技云報到:找到真場景,抓住真需求,這樣的具身智能才是AI
    的頭像 發表于 10-10 14:49 ?7630次閱讀

    適應邊緣AI全新時代的GPU架構

    電子發燒友網站提供《適應邊緣AI全新時代的GPU架構.pdf》資料免費下載
    發表于 09-15 16:42 ?47次下載

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構

    射頻模擬處理器的原型與概念驗證 3、光電組合AI芯片 目前最好的應對Transformer模型需要的極高算力的方法之一就是使用光子計算芯片來代替基于CMOS的芯片。 光電組合AI芯片的創新點是光和電
    發表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,FPGA屬于AI芯片這個
    發表于 09-12 16:07

    AI 芯片浪潮下,職場晉升新契機?

    職場、渴望在專業領域更進一步的人來說,AI 芯片與職稱評審之間,實則有著千絲萬縷的聯系,為職業晉升開辟了新的路徑。 AI 芯片領域細分與職稱對應 目前,AI 芯片從技術架構上主要分為 GPU
    發表于 08-19 08:58

    AI芯片,需要ASIC

    電子發燒友網報道(文/李彎彎) 2025年,全球AI芯片市場正迎來一場結構性變革。在英偉達GPU占據主導地位的大格局下,ASIC(專用集成電路)憑借針對AI任務的定制化設計,成為推動算
    的頭像 發表于 07-26 07:30 ?6783次閱讀

    從14nm到3nm:AI ASIC算力、能效雙突破

    電子發燒友網報道(文/李彎彎)2025年,全球AI芯片市場正迎來一場結構性變革。在英偉達GPU占據主導地位的大格局下,ASIC(專用集成電路)憑借針對AI任務的定制化設計,成為推動算力
    的頭像 發表于 07-26 07:22 ?6838次閱讀

    智算加速卡是什么東西?它真能在AI戰場上干掉GPU和TPU!

    隨著AI技術火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環節,算力才是硬通貨。你有沒有發現,現在越來越多的AI企業不光用
    的頭像 發表于 06-05 13:39 ?1648次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰場上干掉<b class='flag-5'>GPU</b>和TPU!

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態

    的深度融合展開合作。雙方結合 Imagination 領先的 GPU IP 技術與澎峰科技在 AI 模型壓縮與性能優化方面的軟硬協同能力,共同開拓面向 AI 行業應用的計算解決方案
    發表于 05-21 09:40 ?1220次閱讀

    英特爾發布全新GPUAI和工作站迎來新選擇

    英特爾推出面向準專業用戶和AI開發者的英特爾銳炫Pro GPU系列,發布英特爾? Gaudi 3 AI加速器機架級和PCIe部署方案 ? 2025 年 5 月 19 日,北京 ——今日,在
    發表于 05-20 11:03 ?1845次閱讀

    【「零基礎開發AI Agent」閱讀體驗】+ 入門篇學習

    工程、RAG技術、和AI Agent是3個重要方面。其中AI Agent作為2024年最新興的技術領域,具備很好的應用前景,本書對零基礎小白普及和應用AI Agent有著很好的指導作用
    發表于 05-02 09:26

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPUAI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的 NVIDIA Studio 驅動現已開放下載。
    的頭像 發表于 03-28 09:59 ?1306次閱讀