91啦丨九色丨刺激,久久久久成人精品一区二区,东京热加勒比一区二区三区

昨天發(fā)的《云廠商的AI決戰(zhàn)》里，我們聊到一個關(guān)鍵判斷：今天的AI云競爭，早就不是比誰家GPU多、Token跑得快了，而是進入了全棧AI Infra的深水區(qū)。

今天咱們就順著這個思路再往下探一層：既然勝負(fù)手不在表面指標(biāo)，而在底層效率，那到底該怎么評估一家云廠商是不是真的能打？

回望2025年，AI Infra的發(fā)展已經(jīng)清晰地走過了一個關(guān)鍵拐點。過去一年，模型能力的躍遷不再只是參數(shù)規(guī)模的競賽，而是越來越多地被算力可獲得性、成本結(jié)構(gòu)、部署效率所重新定義。頭部廠商在GPU云、算力調(diào)度、異構(gòu)集群以及工程化落地能力上的差距逐漸拉大，而這種分化正決定著誰有能力真正承載下一階段的AI商業(yè)化浪潮。

在這一進程中，一些曾被廣泛依賴的評估標(biāo)準(zhǔn)開始顯露出其局限性。

比如，Token這個易于量化、便于傳播的指標(biāo)，一度被部分廠商視為衡量AI云市場的北極星。但現(xiàn)實卻給出了不同的答案：國家統(tǒng)計局最新數(shù)據(jù)顯示，2025年中國日均Token消耗量已從年初的約1000億飆升至30萬億。但據(jù)全球權(quán)威技術(shù)市場研究機構(gòu)Omdia統(tǒng)計，按Token計費的MaaS服務(wù)收入僅占整個AI云市場規(guī)模的不到1%。

究其原因，大量發(fā)生在GPU云租賃、私有化部署乃至端側(cè)設(shè)備的AI算力消耗根本無法被MaaS平臺統(tǒng)計。將Token等同于AI云本身，不僅忽略了中國數(shù)字化市場復(fù)雜多樣的需求，更可能誤判了真正的技術(shù)護城河。同樣具有誤導(dǎo)性的還有對硬件數(shù)量的迷信，GPU的絕對數(shù)量并不等于穩(wěn)定、高效的可用算力，某頭部云廠商的模型市場中曾出現(xiàn)17.7%的GPU算力僅用于處理1.35%的極少量請求，資源浪費嚴(yán)重。

由此可見，評估一家云廠商的GPU云實力，不能只看Token消耗量或GPU卡數(shù)，而應(yīng)關(guān)注其底層系統(tǒng)的整體效率與可控性。而要實現(xiàn)這種效率與可控性，往往離不開對基礎(chǔ)設(shè)施的深度掌控。

正是在這一背景下，具備自研GPU云能力的廠商逐漸顯現(xiàn)出結(jié)構(gòu)性優(yōu)勢：它們不僅能規(guī)避通用硬件的性能瓶頸與供應(yīng)鏈風(fēng)險，還能在軟硬協(xié)同、調(diào)度優(yōu)化和成本控制上實現(xiàn)更高維度的突破。

于是，當(dāng)堆砌硬件的競賽逐漸失效、大模型進入工程期后，一個更深刻的問題浮出水面：云廠商選擇什么樣的AI Infra的建設(shè)路徑才真的可持續(xù)？對于志在擁抱AI的企業(yè)而言，決定其智能化進程成敗的究竟是采購了多少塊芯片，還是選擇一個具備怎樣系統(tǒng)性效率的合作伙伴？

在模型快速發(fā)展的關(guān)鍵時期，打開任何一篇關(guān)于AI基礎(chǔ)設(shè)施的報道，幾乎都會看到這樣的討論：誰又拿到了多少H20或B200？哪家云廠商降價了多少？卡型、規(guī)格、單價、交付周期……似乎只要擁有更多高端GPU，就能在這場AI競賽中勝出。

這種“唯卡論”的敘事在過去一段時間確實主導(dǎo)了市場情緒。畢竟，在大模型訓(xùn)練高度依賴算力的背景下，硬件似乎成了最直觀的勝負(fù)手。然而，隨著行業(yè)從狂熱擴張走向理性落地，越來越多的實踐案例開始揭示一個行業(yè)現(xiàn)實：擁有算力，不等于能用好算力。AI算力的價值，最終要通過高效、穩(wěn)定、可規(guī)模化的服務(wù)形式釋放出來。

而這其中最關(guān)鍵的板塊就是GPU云。GPU云作為AI基礎(chǔ)設(shè)施的核心，其競賽邏輯已經(jīng)發(fā)生了根本性變革。

一方面，高端GPU供應(yīng)鏈高度集中且波動劇烈。市場機構(gòu)IDC統(tǒng)計數(shù)據(jù)顯示，英偉達在訓(xùn)練級AI芯片（如H100、H200、B200）領(lǐng)域占據(jù)全球超90%的市場份額，而在中國市場，受出口管制影響，H20、L20等合規(guī)型號供應(yīng)持續(xù)緊張，價格波動劇烈，交付周期長達數(shù)月，即便企業(yè)愿意支付溢價，也未必能及時拿到所需資源。

但比拿不到更棘手的，是“用不好”。以近期備受關(guān)注的英偉達H200為例，盡管已有消息傳出春節(jié)前可交付數(shù)萬顆的消息，但即便交易成行，H200也早已不是技術(shù)前沿。它的下一代Blackwell系列（如B200/GB200）性能更高。更重要的是，即便企業(yè)成功采購到H200，若缺乏底層系統(tǒng)整合能力，依然難以發(fā)揮其潛力。

許多智算中心直接部署整機柜設(shè)備，卻在上層面臨調(diào)度系統(tǒng)割裂、通信協(xié)議不統(tǒng)一、驅(qū)動與框架適配粗糙等問題，導(dǎo)致跨節(jié)點任務(wù)調(diào)度效率低下、故障恢復(fù)緩慢、資源碎片化嚴(yán)重。結(jié)果往往是顯存占滿，算力空轉(zhuǎn)。

這一矛盾在現(xiàn)實中尤為突出。在“2025云網(wǎng)智聯(lián)大會”上，SNAI推委會榮譽主席韋樂平指出，當(dāng)前國內(nèi)智算中心已超280個，看似算力充沛，實則GPU平均利用率不足30%，且分布極不均衡。大量設(shè)施長期閑置或低效運行，暴露出典型的“有硬件、無體系”短板。而隨著MoE（Mixture of Experts）等新一代大模型架構(gòu)的普及，對算力調(diào)度精度、通信效率和資源彈性的要求更是大幅提升，這也進一步放大了能用與好用之間的鴻溝。

問題顯然不在芯片本身，而在于缺少一套自主可控、軟硬協(xié)同的全棧技術(shù)底座。今天的GPU云競爭早已超越資源囤積階段，進入系統(tǒng)工程深水區(qū)，成為芯片、集群、調(diào)度、穩(wěn)定性與商業(yè)化服務(wù)有機整合的綜合博弈。

也正是在這樣的行業(yè)轉(zhuǎn)折點上，百度昆侖芯、華為昇騰等國產(chǎn)AI芯片開始嶄露頭角，贏得越來越多頭部客戶的實際認(rèn)可。國際權(quán)威咨詢機構(gòu)弗若斯特沙利文發(fā)布的《2025年中國GPU云市場研究報告》清晰捕捉到了這一趨勢。報告首次以“自研AI加速芯片 + 萬卡級算力集群 + 云服務(wù)商業(yè)化能力”為三大核心維度，對中國GPU云市場進行系統(tǒng)評估。

報告指出，2025年上半年的中國自研GPU云市場中，百度智能云以40.4%的市場份額位居第一，華為云以29.5%份額位居第二，其他廠商合計份額為30.1%。值得注意的是，此前百度智能云已經(jīng)連續(xù)六年穩(wěn)居AI云領(lǐng)域榜首。

乍看之下，這似乎只是又一份廠商排名，但結(jié)合當(dāng)下GPU云市場的現(xiàn)實，這個第一其實揭示了一個更深層的趨勢，AI基礎(chǔ)設(shè)施的競爭正在從搶卡轉(zhuǎn)向用卡，以及更深層次、更系統(tǒng)性的布局。

沿著這條路徑，我們可以以百度智能云這個領(lǐng)先的案例去看一看，為什么GPU云競賽的焦點不再是某一個單一指標(biāo)，而是轉(zhuǎn)變成了一整個系統(tǒng)工程的轉(zhuǎn)型。

自研AI基礎(chǔ)設(shè)施從來不是一條容易走的路，投入大、周期長、技術(shù)風(fēng)險高，任何一個環(huán)節(jié)都可能讓前期努力付諸東流，且短期內(nèi)難以看到商業(yè)回報。正因如此，盡管“全棧自研”被廣泛視為長期競爭力的關(guān)鍵，真正躬身入局的玩家卻寥寥無幾。目前，在中國AI云市場中，僅有百度智能云、華為云等少數(shù)頭部廠商選擇堅持這一路徑，并形成了從底層算力到上層應(yīng)用的高效閉環(huán)。

回溯他們脫穎而出的路徑，一個關(guān)鍵問題浮現(xiàn)出來：領(lǐng)先，究竟源于什么？

根據(jù)報告來看，答案并非某個單點技術(shù)的突破，而是一整套關(guān)于自研芯片、集群規(guī)模、云服務(wù)能力的長期實踐。

以百度智能云為例，從硬件底層開始，其就選擇從自研AI芯片昆侖芯切入，為整個算力體系預(yù)留了持續(xù)演進的空間。算力架構(gòu)不再被通用硬件鎖定，而是能圍繞真實模型需求動態(tài)優(yōu)化。值得注意的是，昆侖芯的研發(fā)起源于十余年前百度對大規(guī)模搜索場景下FPGA加速器的深度探索，其從誕生之初，就帶有為AI基礎(chǔ)設(shè)施服務(wù)的強烈基因。目前，昆侖芯已完成數(shù)萬卡的規(guī)模化部署，服務(wù)于招商銀行、南方電網(wǎng)、中國鋼研等上百家行業(yè)客戶。

目前昆侖芯不僅能大規(guī)模支撐百度內(nèi)部的推理業(yè)務(wù)，在訓(xùn)練層面也取得了一定的成績，而前不久發(fā)布的全新一代AI芯片，在面向大規(guī)模推理場景進行深度優(yōu)化的同時，也將推出更適配多模態(tài)模型超大規(guī)模訓(xùn)推的產(chǎn)品，為后續(xù)的算力演進預(yù)留空間。

芯片只是起點，要釋放規(guī)模算力的真正價值，還需要更高維度的系統(tǒng)整合。為此，在節(jié)點層，百度智能云進一步構(gòu)建了百度天池超節(jié)點，通過更高密度的算力組織與更低延遲的互聯(lián)，為大規(guī)模并行計算提供穩(wěn)定基礎(chǔ)。根據(jù)百度智能云官方披露，相比上一代產(chǎn)品，天池256超節(jié)點的整體性能提升50%，天池512超節(jié)點單個超節(jié)點即可支撐萬億參數(shù)模型訓(xùn)練，大幅降低跨節(jié)點通信開銷與任務(wù)碎片化。

單節(jié)點的強悍能夠進一步提升算力使用的性價比，也讓集群的建設(shè)更加快速。2025年4月，百度智能云就已經(jīng)點亮了昆侖芯三萬卡集群，在去年11月的百度世界大會上，百度智能云表示還將不斷擴大集群規(guī)模，未來目標(biāo)推向百萬級。

隨著算力規(guī)模邁過萬卡向更高層次進發(fā)，挑戰(zhàn)也從"有沒有算力"轉(zhuǎn)向"能不能用好算力"。

面對大規(guī)模的模型訓(xùn)推需求，在高并發(fā)、高負(fù)載的情況下保持可預(yù)期的性能表現(xiàn)至關(guān)重要。在最上層，上述那些分散在芯片，超節(jié)點與集群層面的能力被百度百舸AI計算平臺上進一步整合、放大，并以云服務(wù)的形式高效輸出。

據(jù)悉，百度百舸5.0在深度適配昆侖芯的同時，也支持多款國內(nèi)外主流芯片，在超大規(guī)模集群上的有效訓(xùn)練時長超過95%，從結(jié)果來看，其在異構(gòu)算力調(diào)度和集群穩(wěn)定性方面已相當(dāng)成熟。不只是穩(wěn)定性，百度百舸定位面向大模型訓(xùn)推一體化的AI基礎(chǔ)設(shè)施，能夠通過領(lǐng)先的AI工程加速能力，覆蓋企業(yè)在模型開發(fā)、訓(xùn)練、部署及推理的全流程需求，為AI落地提供高效易用的服務(wù)。

這種多維度、全棧式的能力建設(shè)，顯著提升了對客戶多樣化、復(fù)雜化AI需求的支撐能力。目前，百度智能云已服務(wù)超過65%的央企、全部系統(tǒng)重要性銀行、95%的主流車企、一半以上的頭部游戲公司，以及眾多走在前沿的具身智能企業(yè)。這些對穩(wěn)定性、安全性和效率要求極高的客戶，用真金白銀投出了信任票。

可以說，百度智能云的全棧優(yōu)勢再次證明了研發(fā)為王、底層自研這種長期主義邏輯。在技術(shù)深水區(qū)，沒有捷徑可走。唯有堅持底層自研、系統(tǒng)思維與工程落地三者合一，才能構(gòu)筑真正難以逾越的競爭壁壘。如今市場份額位居第一，本質(zhì)上就是對這條路線已然跑通的有力驗證。

站在產(chǎn)業(yè)演進的高度回望，GPU云的競爭早已超越技術(shù)參數(shù)與市場份額的表層較量，其真正價值在于，能否成為千行百業(yè)智能化轉(zhuǎn)型的可靠底座。

隨著模型智能的進一步提升，大規(guī)模推理需求開始對GPU云提出了更高的要求。各行各業(yè)正在將AI融入業(yè)務(wù)流程，具身智能、AI Agent等新興應(yīng)用的發(fā)展，對AI基礎(chǔ)設(shè)施提出了更為苛刻的需求。這不僅僅是峰值算力，還包括低延遲響應(yīng)、高通信效率、確定性調(diào)度以及長期可用性。

過去幾年，大模型從實驗室走向工廠、電網(wǎng)、銀行和汽車生產(chǎn)線。但當(dāng) AI 從“試驗性能力”進入“業(yè)務(wù)基礎(chǔ)設(shè)施”階段，產(chǎn)業(yè)側(cè)提出的要求發(fā)生了本質(zhì)變化。

產(chǎn)業(yè)客戶要的從來都不只是最強算力，更是穩(wěn)定、安全、可預(yù)期、可負(fù)擔(dān)的智能服務(wù)。他們無法承受因調(diào)度抖動導(dǎo)致訓(xùn)練中斷，不能接受因芯片斷供而業(yè)務(wù)停擺，更難以承擔(dān)高昂且不可控的推理成本。在這樣的現(xiàn)實需求面前，單純堆砌英偉達GPU的“快餐式”方案顯得力不從心。硬件再強，若缺乏底層協(xié)同與長期演進能力，終究難以支撐產(chǎn)業(yè)級AI的持續(xù)運行。

也正是在這一現(xiàn)實約束下，國產(chǎn)GPU云的縱深價值開始顯現(xiàn)，云廠商需要通過從芯片到超節(jié)點，再到集群與云服務(wù)的全棧布局，構(gòu)建高度協(xié)同、自主可控的AI基礎(chǔ)設(shè)施體系。這種系統(tǒng)性能力，不僅降低了大規(guī)模AI應(yīng)用的工程門檻，更讓企業(yè)在面對快速演進的技術(shù)環(huán)境時，擁有了更強的適應(yīng)力與確定性。

例如，百度天池超節(jié)點可將單卡性能提升95%，單實例推理性能提升高達8倍；華為昇騰910B的FP16算力達到256 TFLOPS，寒武紀(jì)思元590在邊緣端推理能跑出128 TOPS。這些性能優(yōu)勢使得國產(chǎn)芯片在實際應(yīng)用中展現(xiàn)出強大的競爭力。

實際業(yè)務(wù)中，國產(chǎn)AI云已經(jīng)深度結(jié)合進產(chǎn)業(yè)之中，百度智能云以昆侖芯P800為核心，結(jié)合百度百舸AI計算平臺5.0，為招商銀行提供高效、穩(wěn)定的算力支持，推動大模型在金融場景的深度應(yīng)用；百度智能云與長安汽車共建長安汽車智算中心，為深藍汽車等在售全系車型提供實時推理算力支持，總算力規(guī)模已超1000PFLOPs。

對企業(yè)和開發(fā)者而言，選擇GPU云，本質(zhì)上是在選擇未來數(shù)年AI演進的底座。從自研芯片，到超節(jié)點算力組織，再到云平臺級的統(tǒng)一調(diào)度與服務(wù)輸出，這種縱向一體化能力，決定了這一底座是否穩(wěn)定、可控、可持續(xù)。它降低的不只是技術(shù)門檻，更是產(chǎn)業(yè)在使用AI過程中面臨的不確定性成本。

一個經(jīng)過全棧優(yōu)化、具備長期演進能力的基礎(chǔ)設(shè)施，不僅能支撐當(dāng)前模型訓(xùn)練與推理需求，更能為未來的架構(gòu)升級、成本優(yōu)化和業(yè)務(wù)創(chuàng)新預(yù)留空間。底座越牢固，底層加持越顯著，在應(yīng)用層和模型層構(gòu)建的差異化優(yōu)勢也就越難以被復(fù)制。

更重要的是，這種自研路徑為中國產(chǎn)業(yè)保留了技術(shù)主動權(quán)。在全球供應(yīng)鏈高度不確定的背景下，一個能同時駕馭國產(chǎn)芯片與國際硬件、并實現(xiàn)高效調(diào)度的平臺，意味著企業(yè)不必在安全與性能之間做痛苦取舍。AI由此真正從可選項變?yōu)楸剡x項。

因此，GPU云的競爭終局，不是資源規(guī)模的簡單比拼，而是系統(tǒng)效率與長期價值的較量。在這場比耐力、比深度、比工程定力的長跑中，真正能將算力轉(zhuǎn)化為穩(wěn)定生產(chǎn)力的一方，才有望笑到最后，托起最廣闊的產(chǎn)業(yè)未來。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
5194

瀏覽量
135422
AI

AI

+關(guān)注

關(guān)注
91

文章
39746

瀏覽量
301338

搜索歷史

從囤卡競賽到全棧競爭：GPU云賽道在卷什么？

評論