国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達的破綻

佐思汽車研究 ? 來源:知乎 ? 2023-08-03 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

看到夏core寫了篇夏晶晶:談一下英偉達帝國的破腚(來源:知乎),決定蹭個熱度,講點不一樣的看法。LLM的出現(xiàn)以及NVidia暴漲的股價和銷量確實讓很多人重新思考AI芯片的機會。夏core提到了很多個點都很有道理,比如關于GPU成本的分析,再比如最后戰(zhàn)略視角去看,產(chǎn)業(yè)利潤分配的不均是最大的破綻。不過戰(zhàn)術層面的想法還是有些問題的。

比如LPDDR和HBM卷成本,如果考慮的是$/GB,那LPDDR確實有優(yōu)勢,但如果考慮的是$/GBps,HBM還是最具性價比的選擇。而LLM雖然對內存容量有比較大的需求,但對于內存帶寬同樣有巨大的需求。單純容量的話,CPU內存可以輕輕松松堆好幾TB,比GPU便宜多了。LLM的參數(shù)和kv緩存都是實打實的內存容量占用大頭,而這些參數(shù)在每一輪forward的過程都全部要用一遍,這也就意味著你把內存里的數(shù)據(jù)都讀出來一遍要多久(即內存的容量和帶寬比)反而是最重要的。而擴內存帶寬一定需要增加DRAM bank數(shù)量從而等比擴內存容量,但擴內存容量可以把多個bank掛到一個通道上不增加內存帶寬,所以算成本的時候關鍵要看$/GBps,這方面HBM是最具性價比的選擇。

至于夏core提到的擴互聯(lián)帶寬,利用NVidia被美國出口管制卡帶寬的機會,確實是一個好的路子,但我覺得更重要的點在于,在LLM的游戲規(guī)則下,內存容量、內存帶寬以及互聯(lián)帶寬成了最核心的競爭力,而算力的重要性下降了,這才是NVidia戰(zhàn)術層面最大的破綻。你看,AMD發(fā)布MI300X可是對算力指標提都不提,只提內存容量、內存帶寬以及互聯(lián)帶寬。放在之前的AI芯片發(fā)布會上是完全不可能的事情,去年的時候大家都還在拼命吹算力指標。

76e7044e-31ab-11ee-9e74-dac502259ad0.jpg

Intel規(guī)劃的2025年的Falcon Shores GPU也規(guī)劃了288GB內存容量和9.8TB/s帶寬,我們先不考慮Intel會不會繼續(xù)跳票的問題,至少內存容量、內存帶寬以及互聯(lián)帶寬成了最核心的競爭力這一點,幾家半導體頭部大廠都是達成共識的。

那這為什么又是NVidia的破綻呢?因為內存容量、內存帶寬以及互聯(lián)帶寬都是標準化的,而算力是非標準化的。算力的非標準化是NVidia在過去十年最大的護城河,因為TOPS和TFLOPS是不一樣的,SIMT算力和DSA算力也是不一樣的,甚至AMD算力和NVidia算力也是不一樣的。過去AI芯片的核心競爭力在于算力,為了卷算力指標,有些廠商在TOPS和TFLOPS上玩花活,有些廠商在SIMT和DSA上玩花活,即使SIMT廠商,也需要在SIMT算力的具體實現(xiàn)上玩花活,不然難以對NVidia的算力指標產(chǎn)生競爭力。而這些花活的代價就是算力的非標準化,從而形成了CUDA深厚的護城河。

看過我之前文章的朋友都直到我在過去好多年都是在探討如何構建一個有競爭力的DSA算力范式,因為要在算力上競爭過NVidia,一方面要有對算力指標的需求來覆蓋算力遷移成本,這個在過去是成立的。另一方面需要有一個和NVidia的CUDA算力相比有競爭力的算力范式,而算力的顯性指標是TFLOPS,隱性指標是達到TFLOPS的開發(fā)時間成本(也就是易用性),我過去很多關于SIMT算力和DSA算力在編譯器層面的探討都是圍繞解決最后一環(huán)展開的,因為這是在過去的需求和市場條件下干老黃的唯一途徑。

但現(xiàn)在算力指標的重要性下降,前面這種干老黃的路徑的基礎邏輯崩塌了,對算力指標的需求下降了,覆蓋算力遷移成本的動力是更不足的,但一個更有潛力的干老黃的路徑出現(xiàn)了。

算力指標重要性的下降使得大家可以放棄在算力范式層面玩花活搞競爭力,轉而去追求內存容量、內存帶寬以及互聯(lián)帶寬的花活,這個層面玩花活的好處是他最后的指標是標準化的,只要你的花活真的能把這些指標懟上去,沒有太多隱性的護城河卡著你。而算力方面則可以盡量做到標準化,照著事實標準去做就行了,哪怕指標差一點,但堆到幾十TFLOPS的CUDA算力和幾百TFLOPS的矩陣算力其實都是可以做到的。

這時候通過市場對于大內存帶寬、大互聯(lián)帶寬的需求來覆蓋算力遷移成本,同時又通過算力標準化來降低這個遷移成本。更進一步,現(xiàn)在大模型訓練、推理、部署的系統(tǒng)軟件也正處于蓬勃造輪子的時期,處于大量新增代碼的積累階段,一系列全新的生態(tài)位正處于形成過程中,一個超大容量和帶寬的準標準化算力是有足夠卡這些全新生態(tài)位潛力的。

此外,夏core文章最后講的戰(zhàn)略層面的破綻產(chǎn)業(yè)利潤分配的不均也是蘊含在這背后的。

天下財共一石,老黃獨占八斗。
這是對全天下IT產(chǎn)業(yè)的傷害,包括TSMC,一個健康的產(chǎn)業(yè),其整個環(huán)節(jié)是需要一個合理的分配比例的,你要說Logic制造的技術含量最高,但是分成的收益卻不到1%,這種分配關系不足以長期維系,tsmc的工藝演進是需要錢的(靠的就是大家共籌,利益均分),如果全世界IT就這么多錢,英偉達你是可以通過系統(tǒng)優(yōu)勢拿走更多,但產(chǎn)業(yè)鏈中tsmc及其他各個環(huán)節(jié)就會更加艱難。三星的HBM其實同理,操了白粉的心,賣個白菜的價,不值得。

在LLM重新創(chuàng)建的邊界條件下,最大的需求HBM卻賣了個白菜價,只因老黃提供了事實標準的算力把這些內存帶寬連起來就吞了九成以上的利潤,這種不健康的產(chǎn)業(yè)利潤分配其實給廣大造反者提供了巨大的機會,畢竟一個準標準化的算力誰不會造(chao)呢?

當然了,雞血打完也還是要潑點冷水。首先這些道理老黃肯定比我們都有更深刻的認識,處于守勢的老黃其實有很多見招拆招的手段。夏core提的通過美帝的出口管制反向卡老黃的互聯(lián)帶寬,其實AMD的形態(tài)就是老黃可以破解的方法。如果老黃能在一張卡里就把大模型全部塞進去,大互聯(lián)帶寬最主要的需求就破解了,剩下的都可以靠其他并行模式以及廣大程序員優(yōu)化出來,你互聯(lián)帶寬大任你大,我一堆“超大卡”之間卡著出口管制的帶寬也能把系統(tǒng)跑滿。

老黃最大的優(yōu)勢就在于只要老黃還能滿足大家的需求,甚至只要大家有預期老黃還能在短時間內解決大家主要的需求,遷移算力的需求勢能就難以積累到足夠高度,比如AMD雖然現(xiàn)在拿出了一個核心指標壓NVidia一倍的大殺器,但只要大家仍然預期老黃明年也能掏出這樣一個大家伙,等等不香嗎?畢竟一年時間算力遷移都不一定搞得完的,到時候NVidia來一個差不多指標的,可不就是遷移了個寂寞。玩弄預期方面,老黃可是老手,前有算力增長的黃氏定律取代摩爾定律,老黃明年必然也會給大家塑造帶寬增長的新黃氏曲線,建立大家的預期。可以說,干老黃不光要干老黃當代產(chǎn)品,更要去干老黃給市場塑造的預期曲線。

此外,堆帶寬沒有秘密,老黃在NVLink和HBM上的布局也仍然是行業(yè)領先水平。

不過干老黃雖然不容易,但至少標準化的核心指標競爭終歸是把老黃和各家拉到了一個層面進行競爭,相比前幾年靠DSA在非標算力層面進行不對稱競爭相比,難度還是降低了非常多的。最后引用夏core文章結尾來收尾,與各位同僚共勉。

AI這個行業(yè),也終將,昔日王榭堂前燕 飛入尋常百姓家。這是大勢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99188
  • LPDDR
    +關注

    關注

    0

    文章

    46

    瀏覽量

    6848
  • 算力
    +關注

    關注

    2

    文章

    1532

    瀏覽量

    16744

原文標題:英偉達的破綻

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英偉電話會看Agentic AI推理與FPGA價值

    2026年2月,英偉發(fā)布2026財年Q4財報:營收681億美元,同比增長73%,數(shù)據(jù)中心業(yè)務增長75%——預期中的超預期。更值得關注的,是電話會中反復出現(xiàn)的幾個關鍵詞:Agentic AI、推理
    的頭像 發(fā)表于 03-04 17:07 ?1050次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達</b>電話會看Agentic AI推理與FPGA價值

    麥格納宣布擴大與英偉的戰(zhàn)略合作

    麥格納宣布擴大與英偉的戰(zhàn)略合作,為整車廠基于英偉DRIVE Hyperion平臺的項目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?361次閱讀

    英偉重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉迄今為止規(guī)模最大的一筆收購。但
    的頭像 發(fā)表于 12-26 08:44 ?1.1w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>重磅出手!AI 推理存儲全面覺醒

    黃仁勛:英偉AI芯片訂單排到2026年 英偉上季營收加速增長62%再超預期

    AI芯片總龍頭英偉的財報終于帶來了驚喜;英偉公司發(fā)布財報數(shù)據(jù)顯示,上季營收加速增長62%;再超華爾街預期。業(yè)界都比較振奮,英偉
    的頭像 發(fā)表于 11-20 11:36 ?1255次閱讀

    NVIDIA新聞:英偉10億美元入股諾基亞 英偉推出全新量子設備

    給大家分享一些NVIDIA新聞: 英偉10億美元入股諾基亞 在當?shù)貢r間10月28日,英偉正式宣布將以10億美元入股諾基亞;據(jù)悉英偉
    的頭像 發(fā)表于 10-29 17:12 ?1706次閱讀

    英偉推機器人“新大腦”,黃仁勛:人形機器人3年將普及

    英偉行業(yè)資訊
    jf_15747056
    發(fā)布于 :2025年08月25日 18:01:33

    英偉自研HBM基礎裸片

    電子發(fā)燒友網(wǎng)綜合報道,據(jù)臺媒消息,傳聞英偉已開始開發(fā)自己的HBM基礎裸片,預計英偉的自研HBM基礎裸片采用3nm工藝制造,計劃在2027年下半年進行小批量試產(chǎn)。并且這一時間點大致對
    的頭像 發(fā)表于 08-21 08:16 ?2811次閱讀

    國家網(wǎng)信辦約談英偉

    近日,英偉算力芯片被曝出存在嚴重安全問題。此前,美議員呼吁要求美出口的先進芯片必須配備“追蹤定位”功能。美人工智能領域專家透露,英偉算力芯片“追蹤定位”“遠程關閉”技術已成熟。為維
    的頭像 發(fā)表于 07-31 13:56 ?2708次閱讀
    國家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達</b>

    施耐德電氣與英偉深化合作

    近日,施耐德電氣宣布與英偉深化合作,旨在滿足市場對可持續(xù)、AI就緒基礎設施日益增長的需求。
    的頭像 發(fā)表于 06-24 15:02 ?1225次閱讀

    英偉擬再推中國特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報道 近年來,美國政府對華半導體出口管制政策不斷收緊,英偉等半導體企業(yè)面臨嚴峻挑戰(zhàn)。為保持在中國市場的競爭力,英偉推出了多款特供版GPU,以滿足政策限制下的市場需求
    發(fā)表于 05-27 00:03 ?4796次閱讀

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    據(jù)外媒報道,英偉公司發(fā)布了一項通知稱,美國政府于9日告知英偉公司;特供版的H20芯片出口到中國需要許可證,緊接著在14日又告知英偉
    的頭像 發(fā)表于 04-16 16:59 ?2087次閱讀

    IBM攜手英偉AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數(shù)據(jù)平臺參考架構(reference architecture)進
    發(fā)表于 03-24 19:20 ?516次閱讀

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    宣布在英偉 Grace Blackwell 平臺上實現(xiàn)高達 30 倍的預期性能提升,加速下一代半導體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態(tài)系統(tǒng)的一部分,展示了全棧EDA
    發(fā)表于 03-19 17:59 ?494次閱讀

    新思科技亮相英偉GTC 2025大會

    為了實現(xiàn)這一速度提升,新思科技在GTC全球AI大會上宣布,正在使用英偉 CUDA-X庫優(yōu)化其下一代半導體開發(fā)解決方案。公司還在擴大對英偉Grace CPU架構的支持,并將在2025
    的頭像 發(fā)表于 03-19 17:53 ?1302次閱讀