国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU的歷史性時刻!

芯司機 ? 來源:芯司機 ? 2023-08-29 15:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

8月23日,GPU巨頭Nvidia發布了2023年二季度財報,其結果遠超預期。總體來說,Nvidia二季度的收入達到了135億美元,相比去年同期增長了101%;凈利潤達到了61億美元,相比去年同期增長了843%。Nvidia公布的這一驚人的財報一度在盤后讓Nvidia股票大漲6%,甚至還帶動了眾多人工智能相關的科技股票在盤后跟漲。

Nvidia收入在二季度如此大漲,主要靠的就是目前方興未艾的人工智能風潮。ChatGPT為代表的大模型技術從去年第三季度以來,正在得到全球幾乎所有互聯網公司的追捧,包括美國硅谷的谷歌、亞馬遜以及中國的百度、騰訊、阿里巴巴等等巨頭。而這些大模型能進行訓練和推理的背后,都離不開人工智能加速芯片,Nvidia的GPU則是大模型訓練和推理加速目前的首選方案。由于個大科技巨頭以及初創公司都在大規模購買Nvidia的A系列和H系列高端GPU用于支持大模型訓練算力,這也造成了Nvidia的數據中心GPU供不應求,當然這反映到財報中就是收入和凈利潤的驚人增長。

9ac214b6-4633-11ee-a2ef-92fbcf53809c.png

事實上,從Nvidia的財報中,除了亮眼的收入和凈利潤數字之外,還有一個關鍵的數字值得我們關注,就是Nvidia二季度的數據中心業務收入。根據財報,Nvidia二季度的數據中心業務收入超過了100億美元,相比去年同期增長171%。Nvidia數據中心業務數字本身固然非常驚人,但是如果聯系到其他公司的同期相關收入并進行對比,我們可以看到這個數字背后更深遠的意義。同樣在2023年第二季度,Intel的數據中心業務收入是40億美元,相比去年同期下降15%;AMD的數據中心業務收入是13億美元,相比去年同期下降11%。我們從中可以看到,在數據中心業務的收入數字上,Nvidia在2023年第二季度的收入已經超過了Intel和AMD在相同市場收入的總和。

這樣的對比的背后,體現出了在人工智能時代,人工智能加速芯片(GPU)和通用處理器芯片(CPU)地位的反轉。目前,在數據中心,人工智能加速芯片/GPU事實上最主流的供貨商就是Nvidia,而通用處理器芯片/CPU的兩大供貨商就是Intel和AMD,因此比較Nvidia和Intel+AMD在數據中心領域的收入數字就相當于比較GPU和CPU之間的出貨規模。雖然人工智能從2016年就開始火熱,但是在數據中心,人工智能相關的芯片和通用芯片CPU相比,獲得的市場份額增長并不是一蹴而就的:在2023年之前,數據中心CPU的份額一直要遠高于GPU的份額;甚至在2023年第一季度,Nvidia在數據中心業務上的收入(42億美元)仍然要低于Intel和AMD在數據中心業務的收入總和;而在第二季度,這樣的力量對比反轉了,在數據中心GPU的收入一舉超過了CPU的收入。

這也是一個歷史性的時刻。從上世紀90年代PC時代開始,CPU一直是摩爾定律的領軍者,其輝煌從個人電腦時代延續到了云端數據中心時代,同時也推動了半導體領域的持續發展;而在2023年,隨著人工智能對于整個高科技行業和人類社會的影響,用于通用計算的CPU在半導體芯片領域的地位正在讓位于用于人工智能加速的GPU(以及其他相關的人工智能加速芯片)。

摩爾定律的故事在GPU上仍然在發生

眾所周知,CPU的騰飛離不開半導體摩爾定律。根據摩爾定律,半導體工藝特征尺寸每18個月演進一代,同時晶體管的性能也得大幅提升,這就讓CPU在摩爾定律的黃金時代(上世紀80年代至本世紀第一個十年)突飛猛進:一方面CPU性能每一年半就迭代一次,推動新的應用出現,另一方面新的應用出現又進一步推動對于CPU性能的需求,這樣兩者就形成了一個正循環。這樣的正循環一直到2010年代,隨著摩爾定律逐漸接近物理瓶頸而慢慢消失——我們可以看到,最近10年中,CPU性能增長已經從上世紀8、90年代的15%年復合增長率(即性能每18個月翻倍)到了2015年后的3%年復合增長率(即性能需要20年才翻倍)。

9ad18676-4633-11ee-a2ef-92fbcf53809c.png

但是,摩爾定律對于半導體晶體管性能增長的驅動雖然已經消失,但是摩爾定律所預言的性能指數級增長并沒有消失,而是從CPU轉到了GPU上。如果我們看2005年之后GPU的性能(算力)增長,我們會發現它事實上一直遵循了指數增長規律,大約2.2年性能就會翻倍!

9af32e8e-4633-11ee-a2ef-92fbcf53809c.png

同樣是芯片,為什么GPU能延續指數級增長?這里,我們可以從需求和技術支撐兩方面來分析:需求意味著市場上是不是有應用對于GPU的性能指數級增長有強大的需求?而技術支撐則是,從技術上有沒有可能實現指數級性能增長?

從需求上來說,人工智能確實存在著這樣強烈需求。我們可以看到,從2012年(神經網絡人工智能復興怨念開始)到至今,人工智能模型的算力需求確實在指數級增長。2012年到2018年是卷積神經網絡最流行的年份,在這段時間里我們看到人工智能模型的算力需求增長大約是每兩年15倍。在那個時候,GPU主要負責的是模型訓練,而在推理部分GPU的性能一般都是綽綽有余。而從2018年進入以Transformer架構為代表的大模型時代后,人工智能模型對于算力需求的演進速度大幅提升,已經到了每兩年750倍的地步。在大模型時代,即使是模型的推理也離不開GPU,甚至單個GPU都未必能滿足推理的需求;而訓練更是需要數百塊GPU才能在合理的時間內完成。這樣的性能需求增長速度事實上讓GPU大約每兩年性能翻倍的速度都相形見拙,事實上目前GPU性能提升速度還是供不應求!因此,如果從需求側去看,GPU性能指數級增長的曲線預計還會延續很長一段時間,在未來十年內GPU很可能會從CPU那邊接過摩爾定律的旗幟,把性能指數級增長的神話續寫下去。

9b0c3032-4633-11ee-a2ef-92fbcf53809c.png

GPU性能指數增長背后的技術支撐

除了需求側之外,為了能讓GPU性能真正維持指數增長,背后必須有相應的芯片技術支撐。我們認為,在未來幾年內,有三項技術將會是GPU性能維持指數級增長背后的關鍵。

第一個技術就是領域專用(domain-specific)芯片設計。同樣是芯片,GPU性能可以指數級增長而CPU卻做不到,其中的一個重要因素就是GPU性能增長不僅僅來自于晶體管性能提升和電路設計改進,更來自于使用領域專用設計的思路。例如,在2016年之前,GPU支持的計算主要是32位浮點數(fp32),這也是在高性能計算領域的默認數制;但是在人工智能興起之后,研究表明人工智能并不需要32位浮點數怎么高的精度,而事實上16位浮點數已經足夠用于訓練,而推理使用8位整數甚至4位整數都夠了。而由于低精度計算的開銷比較小,因此使用領域專用計算的設計思路,為這樣的低精度計算做專用優化可以以較小的代價就實現人工智能領域較大的性能提升。從Nvidia GPU的設計我們可以看到這樣的思路,我們看到了計算數制方面在過去的10年中從fp32到fp16到int8和int4的高效支持,可以說是一種低成本快速提高性能的思路。除此之外,還有對于神經網絡的支持(TensorCore),稀疏計算的支持,以及Transformer的硬件支持等等,這些都是領域專用設計在GPU上的很好體現。在未來,GPU性能的提升中,可能是有很大一部分來自于這樣的領域專用設計,往往一兩個專用加速模塊的引入就能打破最新人工智能模型的運行瓶頸來大大提升整體性能,從而實現四兩撥千斤的效果。

第二個技術就是高級封裝技術。高級封裝技術對于GPU的影響來自兩部分:高速內存和更高的集成度。在大模型時代,隨著模型參數量的進一步提升,內存訪問性能對于GPU整體性能的影響越來越重要——即使GPU芯片本身性能極強,但是內存訪問速度不跟上的話,整體性能還是會被內存訪問帶寬所限制,換句話說就是會遇到“內存墻”問題。為了避免內存訪問限制整體性能,高級封裝是必不可少的,目前的高帶寬內存訪問接口(例如已經在數據中心GPU上廣泛使用的HBM內存接口)就是一種針對高級封裝的標準,而在未來我們預期看到高級封裝在內存接口方面起到越來越重要的作用,從而助推GPU性能的進一步提升。高級封裝對于GPU性能提升的另一方面來自于更高的集成度。最尖端半導體工藝(例如3nm和以下)中,隨著芯片規模變大,芯片良率會遇到挑戰,而GPU可望是未來芯片規模提升最激進的芯片品類。在這種情況下,使用芯片粒將一塊大芯片分割成多個小芯片粒,并且使用高級封裝技術集成到一起,將會是GPU突破芯片規模限制的重要方式之一。目前,AMD的數據中心GPU已經使用上了芯片粒高級封裝技術,而Nvidia預計在不久的未來也會引入這項技術來進一步繼續提升GPU芯片集成度。

最后,高速數據互聯技術將會進一步確保GPU分布式計算性能提升。如前所述,大模型的算力需求提升速度是每兩年750倍,遠超GPU摩爾定律提升性能的速度。這樣,單一GPU性能趕不上模型算力需求,那么就必須用數量來湊,即把模型分到多塊GPU上進行分布式計算。未來幾年我們可望會看到大模型使用越來越激進的分布式計算策略,使用數百塊,上千塊甚至上萬塊GPU來完成訓練。在這樣的大規模分布式計算中,高速數據互聯將會成為關鍵,否則不同計算單元之間的數據交換將會成為整體計算的瓶頸。這些數據互聯包括近距離的基于電氣互聯的SerDes技術:例如在Nvidia的Grace Hopper Superchip中,使用NVLINK C2C做數據互聯,該互聯可以提供高達900GB/s的數據互聯帶寬(相當于x16 PCIe Gen5的7倍)。另一方面,基于光互聯的長距離數據互聯也會成為另一個核心技術,當分布式計算需要使用成千上萬個計算節點的時候,這樣的長距離數據交換也會變得很常見并且可能會成為系統性能的決定性因素之一。

我們認為,在人工智能火熱的年代,GPU將會進一步延續摩爾定律的故事,讓性能指數級發展繼續下去。為了滿足人工智能模型對于性能強烈的需求,GPU將會使用領域專用設計、高級封裝和高速數據互聯等核心技術來維持性能的快速提升,而GPU以及它所在的人工智能加速芯片也將會成為半導體領域技術和市場進步的主要推動力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135467
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265402
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5186

原文標題:GPU的歷史性時刻!

文章出處:【微信號:芯司機,微信公眾號:芯司機】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中國算力芯片的拐點時刻

    作者|Taylor出品|芯片技術與工藝當OpenAI的GPT-5在得克薩斯州的機房中晝夜轟鳴,當Nvdia的H200芯片被炒至數十萬美元仍一卡難求,中國的算力芯片產業正站在一個歷史性拐點——這不是
    的頭像 發表于 01-31 07:00 ?1707次閱讀
    中國算力芯片的拐點<b class='flag-5'>時刻</b>

    商業航天產業里國產碳化硅(SiC)功率器件與驅動解決方案的戰略價值分析

    在全球航天工業經歷從政府主導向商業化運作轉型的歷史性時刻,功率電子系統的性能、可靠與成本效益已成為決定運載火箭運力、衛星壽命及星座運營經濟的核心變量。
    的頭像 發表于 01-24 11:15 ?254次閱讀
    商業航天產業里國產碳化硅(SiC)功率器件與驅動解決方案的戰略價值分析

    達實智能助力深圳智慧地鐵出行再升級

    2025年年底,深圳軌道交通迎來歷史性時刻——5號線西延段、8號線三期、11號線二期紅嶺南段、13號線一期北段四條新線(段)同步開門迎客。
    的頭像 發表于 01-21 15:41 ?390次閱讀

    奧托立夫熱烈祝賀蔚來第100萬臺量產車榮耀下線

    2026年1月6日,蔚來汽車在合肥新橋二工廠迎來了第100萬臺量產車的下線,這一時刻凝聚著蔚來十余年的堅守與創新,從一家初創企業成長為引領行業發展的標桿力量。在下線儀式上,奧托立夫董事會成員劉小稚博士受邀出席,見證了這一歷史性時刻
    的頭像 發表于 01-10 16:05 ?2222次閱讀

    東風汽車2025年度高光時刻回顧

    剛剛過去的2025年是“十四五”規劃收官之年,也是銜接“十四五”與“十五五”的關鍵之年,東風汽車高質量發展取得新進展新成效,達成了“雙百萬”的跨越,新能源汽車銷量歷史性跨越百萬輛,達到104萬輛
    的頭像 發表于 01-07 16:51 ?757次閱讀

    禾賽科技2025年度高光時刻回顧

    對于禾賽,2025 更是收獲的一年,禾賽讓創業以來的首個愿景,“全球 1% 的車輛具備三維感知能力”變為現實,還做到了世界第一的年交付量、歷史交付量,市場占有率等全新行業里程碑,也率先實現盈利,實現商業成功的歷史性突破。
    的頭像 發表于 01-06 15:56 ?595次閱讀

    “三個必然”戰略論斷對國產SiC碳化硅功率半導體行業的業務指引作用與產業演進路徑

    全球半導體產業正經歷從硅(Si)基向寬禁帶(WBG)材料轉型的歷史性時刻,中國作為全球最大的功率半導體消費市場,正處于技術迭代與產業鏈重構的十字路口。
    的頭像 發表于 01-04 17:01 ?398次閱讀
    “三個必然”戰略論斷對國產SiC碳化硅功率半導體行業的業務指引作用與產業演進路徑

    Shell歷史命令history用法

    1. 顯示歷史命令列表 「介紹」:history 命令用于顯示當前會話中執行過的命令的列表,以及每個命令對應的編號。「示例代碼」:history 2. 使用歷史命令重復執行命令 「介紹」:通過
    發表于 12-02 06:10

    奧托立夫祝賀一汽大眾達成3000萬輛里程碑

    2025年10月30日,我們重要的合作伙伴一汽-大眾迎來第3000萬輛整車下線的歷史性時刻,標志著其成為國內首家達成這一里程碑的乘用車企業!奧托立夫受邀出席下線儀式,共同見證這一中國汽車工業發展的重大里程碑。
    的頭像 發表于 11-03 09:56 ?531次閱讀

    首款全國產通用GPU芯片發布 沐曦集成推出曦云C600

    沐曦集成電路(南京)有限公司近日正式發布了首款全國產通用GPU——曦云C600,這標志著國產高性能GPU實現歷史性突破。 據新華日報報道顯示,沐曦發布的曦云C600集成了大容量存儲與多種精度混合算力
    的頭像 發表于 10-19 20:04 ?4.6w次閱讀

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經安裝了cuda和cudnn,在全局的py里添加了torch,能夠調用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發表于 07-25 08:18

    營收破百億創歷史,士蘭微做了什么?

    %。 圖/士蘭微 杭州士蘭微表示,公司營業收入首次突破100億元,創造了中國大陸本土成長起來的半導體IDM公司的歷史性時刻。 杭州士蘭微取得如此亮眼的營收成績,其成功的關鍵究竟有哪些? 細分市場紅利釋放,IDM模式持續賦能 2024年,杭州士蘭微在多個高增長細分市場迎來發
    的頭像 發表于 07-17 13:56 ?1339次閱讀
    營收破百億創<b class='flag-5'>歷史</b>,士蘭微做了什么?

    奇瑞墨甲機器人全球批量交付

    近日,奇瑞與AiMOGA團隊聯合研發的墨甲人形機器人在奇瑞國際公司園區完成首批220臺全球交付。來自30多個國家和地區的合作伙伴、海外經銷商及媒體記者共同見證了這一歷史性時刻
    的頭像 發表于 05-06 14:54 ?1332次閱讀

    可以手動構建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發表于 03-28 06:35