(電子發(fā)燒友網(wǎng)報道 文/章鷹)4月9日,美國全國公共廣播電臺(NPR)引述兩位知情者說法稱,美國特朗普政府暫時叫停了將英偉達對華銷售限制擴大至“特供版”人工智能芯片H20的計劃。原本美國數(shù)月來都在對這款芯片實行出口管制,原本準備最快在本周實施。
事情的轉機出現(xiàn)在4月4日,英偉達CEO黃仁勛在總統(tǒng)特朗普的私人住所出席豪華晚宴。英偉達CEO向特朗普承諾將在美國AI數(shù)據(jù)中心進行新投資后,上述的管制計劃出現(xiàn)改變。
4月10日,還有一條爆炸性消息,著名AI科學家李飛飛領銜的斯坦福大學人工智能研究所近日發(fā)布了最新一期《2025年人工智能指數(shù)報告》,報告指出中美頂級AI大模型性能已經(jīng)由2023年的17.5%大幅縮至0.3%,接近抹平。2024年全球重要的大模型中,美國入選40個,中國15個。在業(yè)內(nèi)頂尖專家評選的32項“2024年AI領域重要發(fā)布中”,中國的阿里Qwen2、Qwen2.5及DeepSeek-V3發(fā)布上榜。
為何H20芯片會首先被美國政府放行,這對英偉達的全球戰(zhàn)略有何影響?除了H20芯片外,中國在AI服務器、DeepSeek一體機等重要的算力基礎設施中,還有哪些國產(chǎn)AI芯片選項?本文進行詳細分析。
H20芯片的前世今生,DeepSeek爆火提振了H20的需求
H20芯片是英偉達公司2023年底推出的AI芯片,H20基于英偉達Hopper架構,是H100的簡化版。2023年10月17日,美國更新出口管制標準,要求先進芯片性能超過特定閾值,即需要申請出口許可。在嚴苛的限制條件下,英偉達針對中國市場的特供版H800、A800兩款芯片也面臨禁售,面對新的管制,英偉達定制全新的特供版本H20,供中國使用。英偉達公司于2023年底推出的特供版的AI芯片H20。
H20采用GH100芯片,禁止用張量核心,核心數(shù)量相較于H100減少了41%,在超頻和集群擴展能力上受到了很大限制。H20配置了96GB HBM3顯存,以及4TB/s帶寬,F(xiàn)P8算力為296 TFLOPs,F(xiàn)P16算力為148TFLOPS,集群的理論擴容能力最高5萬張,集群算力合計最高7400P算力,遠低于H100、A800和A100。H100采用Hopper架構,擁有16896個CUDA核心,顯存為80GB HBM3,理論擴容可達5萬張,最多可以達到10萬P算力。
針對LLM大模型業(yè)態(tài)而言,實際使用H20做千卡分布式訓練,H20芯片由于單卡算力規(guī)格低,更適用于垂直類模型的訓練/推理,不容易滿足千億參數(shù)級LLM的訓練需求。
今年1月以來,隨著DeepSeek-R1版本正式發(fā)布上線,作為業(yè)內(nèi)首個比肩GPT4 o1的開源大模型,憑借高性能、低成本、全開放三大優(yōu)勢,成為“國運級科技成果”,引發(fā)使用人工智能的新一輪浪潮。在DeepSeek推理模型爆火后,支持推理的H20芯片就日益受到AI公司的青睞,根據(jù)美國The information報道,字節(jié)跳動、阿里巴巴與騰訊控股等中國公司,在今年3月對英偉達H20芯片下單至少160億美元。
今年2月英偉達發(fā)布2025財年第四季度財報和2025財年全年業(yè)績。財報顯示,截止到1月25日的2025財年英偉達全年營收達到1305億美元,同比增長114%,凈利潤約729億美元,同比增長145%。其中來自英偉達中國區(qū)的營收171.08億美元,達到歷史新高。而3月H20的芯片訂單沖上160億美元,如果因為美國出口管制H20芯片無法向中國出售,英偉達的損失相當慘重。
國產(chǎn)芯片積極布局國產(chǎn)算力
4月9日,在深圳舉辦的中國電子展上,中國聯(lián)合網(wǎng)絡通信有限公司深圳分公司云計算、算網(wǎng)運營BU總經(jīng)理趙成屏表示,公司作為云計算國家隊,聯(lián)通云已經(jīng)成為首個接入DeepSeek大模型的運營商,基于A100智算池、國產(chǎn)910B智算池和合作算力資源池,向客戶提供GPU裸金屬服務器資源,支持專區(qū)隔離,結合專線訪問,滿足客戶強數(shù)據(jù)安全需求,適用于大模型部署、微調(diào)和應用開發(fā)服務。

在2023年美國對華高端AI芯片禁令實施的第187天,華為低調(diào)推出了昇騰910B芯片。這款AI芯片是華為自主研發(fā)、基于國內(nèi)供應鏈核心環(huán)節(jié)的創(chuàng)新成果,擁有每秒320萬億次運算(FP16)的強大算力,為中國AI產(chǎn)業(yè)的發(fā)展帶來了新的突破。昇騰910B的FP16算力是英偉達H20的近2倍,在能效比方面優(yōu)勢明顯,同樣16張顯卡訓練,使用鯤鵬底座的910B比英偉達服務器省電70%。
趙成屏透露,深圳智算節(jié)點建立萬卡集群,坪山機房主要采購昇騰910B芯片,去年到今年算力芯片、算子適配已經(jīng)完成,國產(chǎn)算力逐步服務政府、金融等重點單位,提供模型從CUDA遷移到華為昇騰CANN的全流程工具。在美國持續(xù)斷供大算力AI芯片和國產(chǎn)替代浪潮推動下,昇騰910B生態(tài)正在快速崛起。
國泰海通證券電子聯(lián)系首席分析師舒迪近日表示,2027年上海智能云產(chǎn)業(yè)規(guī)模突破2000億元,國內(nèi)算力資本性支出與海外仍存在較大差距,中美AI領域競爭加劇導致海外AI芯片出口限制加碼,H20能效未能達到國內(nèi)新建IDC能效要求,國產(chǎn)算力芯片預計加速滲透。按照2027年上海市智算規(guī)模力爭達到200EFLOPS,其中自主可控算力占比超70%,基于910B FP16算力 320TFLOPS進行測算,2027年上海市需求910B等效需求62.5萬張。除了910B外,寒武紀思元370、天數(shù)智芯天垓100 芯片、海光DCU K100等都在性能、架構、應用場景和生態(tài)方面各具特點,適配不同的場景。
隨著DeepSeek的開源和國產(chǎn)大模型成本的下降,人工智能技術在企業(yè)的應用場景大幅度拓展,國產(chǎn)算力也有機會在更多行業(yè)應用。在AI服務器之外,服務于個人和企業(yè)應用場景的DeepSeek一體機也日益火爆。DeepSeek一體機以高效、便捷、安全的特點,在市場上迅速取得了顯著成績,浪潮、華為、聯(lián)想、新華三、中興通訊、百度云、聯(lián)通等十幾家企業(yè)都推出相應的產(chǎn)品。一體機方案背后的AI芯片選擇,也成為了業(yè)內(nèi)關注的焦點。
中國聯(lián)合網(wǎng)絡通信有限公司深圳分公司云計算、算網(wǎng)運營BU總經(jīng)理趙成屏展示的聯(lián)通推出的DeepSeek-R1一體機70B版本采用了燧原、華為910B和英偉達4090多款芯片;聯(lián)想和沐熙合作推出了DeepSeek一體機,采用沐熙AI芯片,除了華為昇騰和沐熙之外,其他家采用的AI芯片來自昆侖芯、天數(shù)智芯、海光、壁仞、云天勵飛、景嘉微等。
從算力數(shù)據(jù)看,華為昇騰憑借單卡320 TFLOPS的算力以及優(yōu)良的集群擴展性領先;從能效維度看,沐曦以1.8 TFLOPS/W的能效比以及訓推一體優(yōu)化而表現(xiàn)突出;而在生態(tài)維度上,昆侖芯與百度飛槳深度整合,形成了一定的生態(tài)優(yōu)勢。而天數(shù)智芯則通過異構算力混合訓練降低成本30%。此外,海光的Deepseek一體機搭載海光K100 GPU服務器,采用自主設計DCU芯片,單卡算力突破164TFLOPS,支持百億級模型訓練。
寫在最后
2025年,中美兩國在AI算力基礎設施和AI行業(yè)應用領域的競爭日趨激烈,英偉達CEO黃仁勛此前表示,華為的持續(xù)成功表明了美國遏制中國科技發(fā)展所作的工作沒什么成效,并指出“他們在人工智能領域的影響力逐年增長,我們無法忽視其存在。”
隨著阿里Qwen2、Qwen2.5及DeepSeek-V3在全球大模型領域的上榜,更多中國AI芯片推出新品配合DeepSeek一體機的落地,服務于企業(yè)場景的AI應用加速落地。H20之外,中國AI服務器和終端硬件廠商也具備越來越多的選項。
本文由電子發(fā)燒友原創(chuàng),轉載請注明以上來源。微信號zy1052625525。需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱zhangying@huaqiu.com。
-
AI芯片
+關注
關注
17文章
2140瀏覽量
36826
發(fā)布評論請先 登錄
英偉達官宣H20恢復中國供應,新款GPU震撼來襲
算力租賃市場爆發(fā),H20遭瘋搶!小心掉坑
巨霖科技分享國產(chǎn)SI仿真工具的破局之道
英偉達被傳暫停生產(chǎn)H20芯片 外交部回應
今日看點丨傳英偉達暫停為中國市場定制H20;估值10億美元的Character.AI公司或將出售
今日看點丨央媒刊文:H20既不環(huán)保,也不先進、更不安全;HBM將以每年30%的速度增長
今日看點丨英偉達向臺積電訂購30萬片H20芯片;蘋果回應首次在中國關停直營店
H20禁令反轉!國產(chǎn)AI芯片強勢崛起,誰將成為破局王炸?
評論