電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)DeepSeek-R1是幻方量化旗下深度求索(DeepSeek)公司研發(fā)的推理模型。DeepSeek-R1于2025年1月20日正式發(fā)布。該模型采用強(qiáng)化學(xué)習(xí)進(jìn)行后訓(xùn)練,旨在提升推理能力,尤其擅長(zhǎng)數(shù)學(xué)、代碼和自然語(yǔ)言推理等復(fù)雜任務(wù)。
DeepSeek-R1在發(fā)布后迅速引發(fā)了廣泛關(guān)注,以高性能與低訓(xùn)練成本令外界震驚。DeepSeek表示, DeepSeek-R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。
去年12月底發(fā)布的DeepSeek-V3模型,整個(gè)訓(xùn)練使用2048塊英偉達(dá)H800 GPU僅花費(fèi)約557.6萬(wàn)美元,不到其他頂尖模型訓(xùn)練成本的十分之一。H800是英偉達(dá)特供中國(guó)顯卡,相較于它的旗艦芯片H100降低了部分性能。OpenAI的GPT-4o模型訓(xùn)練采用的是上萬(wàn)個(gè)H100 GPU。DeepSeek-V3性能與GPT-4o相近。而DeepSeek-R1與OpenAI的o1相比,其成本僅為3%-5%。
這意味著,高性能AI模型的開發(fā)不必依賴于昂貴的算力和海量的數(shù)據(jù),卻能達(dá)到國(guó)外頂級(jí)AI大模型的效果。DeepSeek讓大模型推理應(yīng)用更加平民化、普及化,于存儲(chǔ)行業(yè)而言,它既能降低存儲(chǔ)成本,又能激發(fā)更多存儲(chǔ)技術(shù)的創(chuàng)新,拓展存儲(chǔ)應(yīng)用,真正利好存儲(chǔ)行業(yè)的發(fā)展。
降低存儲(chǔ)成本
DeepSeek通過算法優(yōu)化和模型壓縮等技術(shù)大幅降低了AI模型的訓(xùn)練成本。也令一些企業(yè)看到軟件和硬件的結(jié)合,比單純地堆硬件能獲得更佳的效果。DeepSeek不僅降低了對(duì)高端GPU的需求,對(duì)于高性能計(jì)算的關(guān)鍵存儲(chǔ)高帶寬內(nèi)存(HBM)的需求也可能放緩。這使得一些企業(yè)對(duì)AI服務(wù)器的投入或?qū)⒉辉僦塾诟咭?guī)格的配置,從而降低了其購(gòu)置成本。
不過,DeepSeek本身在大模型訓(xùn)練和推理時(shí),仍然離不開高性能存儲(chǔ)。從長(zhǎng)期來(lái)看,AI應(yīng)用對(duì)數(shù)據(jù)存儲(chǔ)容量和速率都有著更高要求。
DeepSeek大模型訓(xùn)練需要處理海量的數(shù)據(jù),像DeepSeek-V3訓(xùn)練使用了大規(guī)模的語(yǔ)料庫(kù),總參數(shù)達(dá)6710億,這些數(shù)據(jù)的存儲(chǔ)、讀取和傳輸都需要大量高性能存儲(chǔ)芯片來(lái)支持。在推理階段,DeepSeek-R1應(yīng)用于智能客服、圖像識(shí)別、自然語(yǔ)言處理等眾多場(chǎng)景時(shí),會(huì)產(chǎn)生大量的中間數(shù)據(jù)和結(jié)果數(shù)據(jù),需要存儲(chǔ)芯片進(jìn)行臨時(shí)或長(zhǎng)期存儲(chǔ)。隨著AI應(yīng)用場(chǎng)景的廣泛落地,存儲(chǔ)芯片的總需求有望增加。
促進(jìn)存儲(chǔ)創(chuàng)新
DeepSeek的技術(shù)發(fā)展可能會(huì)促使存儲(chǔ)芯片制造商探索新的存儲(chǔ)架構(gòu)和解決方案,以更好地滿足AI應(yīng)用的需求。例如,隨著AI模型的本地部署量增加,對(duì)低功耗、高能效的存儲(chǔ)芯片如LPDDR以及高速內(nèi)存的需求可能會(huì)增長(zhǎng)。
近期DeepSeek運(yùn)行在AMD EPYC CPU上,無(wú)需顯卡支持,而搭配高頻內(nèi)存多通道內(nèi)存能夠有效提升運(yùn)行速度,token/秒值得到明顯提升,且功耗低、成本更低。
DeepSeek的算法可適配存內(nèi)計(jì)算架構(gòu),減少數(shù)據(jù)搬運(yùn)能耗。例如,優(yōu)化神經(jīng)網(wǎng)絡(luò)模型以匹配ReRAM(阻變存儲(chǔ)器)的模擬計(jì)算特性。還可與存儲(chǔ)廠商合作優(yōu)化AI加速器與存儲(chǔ)的接口協(xié)議(如CXL),降低系統(tǒng)級(jí)延遲。
計(jì)算和存儲(chǔ)能力的提升是AI技術(shù)持續(xù)進(jìn)步和廣泛應(yīng)用的硬件基礎(chǔ)。AI訓(xùn)練和推理過程中,需要頻繁地讀取和處理海量數(shù)據(jù),高性能計(jì)算芯片要充分發(fā)揮其性能優(yōu)勢(shì),需要高性能的內(nèi)存系統(tǒng)與之匹配。因此,HBM仍然是滿足高強(qiáng)度數(shù)據(jù)處理所不可或缺的內(nèi)存。SK海力士、三星電子、美光三大家的HBM內(nèi)存競(jìng)賽也來(lái)到了HBM4階段,隨著技術(shù)研發(fā)的深入將不斷推出高帶寬HBM內(nèi)存進(jìn)階。
除HBM之外,AI服務(wù)器對(duì)于傳統(tǒng)高性能DIMM內(nèi)存的容量與讀取性能要求也明顯提升,與此相應(yīng)的,DDR5在RDIMM產(chǎn)品的滲透率大幅增長(zhǎng)。同時(shí),AI服務(wù)器進(jìn)行大模型訓(xùn)練時(shí)產(chǎn)生的數(shù)據(jù)相較傳統(tǒng)服務(wù)器的中間數(shù)據(jù)極具保存價(jià)值,因此保存次數(shù)大幅度增加。在此情形下eSSD的高速度、低能耗優(yōu)勢(shì)決定其可以大面積取代HDD,全球各大云服務(wù)提供商均開始大規(guī)模采購(gòu)eSSD。江波龍表示eSSD與RDIMM產(chǎn)品已在互聯(lián)網(wǎng)、運(yùn)營(yíng)商等領(lǐng)域的多個(gè)知名客戶處完成了產(chǎn)品驗(yàn)證和批量出貨,未來(lái)公司將通過與大客戶的深度長(zhǎng)期合作,實(shí)現(xiàn)企業(yè)級(jí)業(yè)務(wù)的持續(xù)高速增長(zhǎng)。
AI推理廣泛落地,存儲(chǔ)需求增長(zhǎng)
根據(jù) IDC 數(shù)據(jù),隨著人工智能進(jìn)入大規(guī)模落地應(yīng)用的關(guān)鍵時(shí)期,云端推理占算力的比例將逐步提升,“預(yù)計(jì)到 2026 年,推理占到 62.2%,訓(xùn)練占 37.8%。”這一預(yù)測(cè)進(jìn)一步強(qiáng)調(diào)了 AI 推理在未來(lái)市場(chǎng)競(jìng)爭(zhēng)中的核心地位。
根據(jù)機(jī)構(gòu)測(cè)算,到2028年人工智能的推理負(fù)載占比有望達(dá)到85%,考慮到云端和邊緣側(cè)巨大的推理需求,未來(lái)推理芯片的預(yù)期市場(chǎng)規(guī)模將是訓(xùn)練芯片的4~6倍。
在邊緣計(jì)算場(chǎng)景下,DeepSeek-R1推理大模型應(yīng)用于AIoT設(shè)備,必將對(duì)低功耗、高耐久存儲(chǔ)提出需求,推動(dòng)NOR Flash、MRAM等細(xì)分市場(chǎng)增長(zhǎng)。
兆易創(chuàng)新談到NOR Flash在 AI終端的應(yīng)用。AIPC方面,隨著BIOS程序量代碼量的不斷增長(zhǎng),對(duì)NORFlash提出了更大容量的需求,即便PC總量維持不變,程序量的增長(zhǎng)也會(huì)帶動(dòng)NORFlash 容量的提升。
AI眼鏡是新的品類,期待AI眼鏡能夠發(fā)展成與TWS可比的品類,新需求對(duì)于NORFlash將會(huì)形成較明顯的拉動(dòng)作用。耳機(jī)方面,目前除了行業(yè)頭部品牌對(duì)于NORFlash的容量需求比較大,大部分中低端的TWS耳機(jī),由于功能相對(duì)簡(jiǎn)單,所以對(duì)NORFlash的容量要求很小。未來(lái)如果AI耳機(jī)能夠升級(jí),對(duì)NORFlash容量的拉動(dòng)就會(huì)比較明顯。如果未來(lái)消費(fèi)者要求耳機(jī)必須加入AI功能,那么隨著AI耳機(jī)滲透率的提升,對(duì)NOR Flash 容量的需求也會(huì)增長(zhǎng),即便耳機(jī)總的銷售臺(tái)數(shù)不增加,只要單機(jī)容量提升,對(duì)市場(chǎng)規(guī)模也是有拉動(dòng)效果的。
寫在最后
DeepSeek的算法革新降低了對(duì)最尖端算力的依賴,最近一大批國(guó)內(nèi)CPU、GPU、AI芯片廠商踴躍適配DeepSeek,將有利于國(guó)產(chǎn)芯片在AI推理市場(chǎng)的競(jìng)爭(zhēng)力提升。DeepSeek推理模型在邊緣計(jì)算設(shè)備和企業(yè)本土化的部署,也將刺激更多推理芯片需求。存儲(chǔ)芯片作為AI存力的組成部分,最先受益的莫過于HBM,如今DeepSeek帶來(lái)的AI推理應(yīng)用大爆發(fā),將帶動(dòng)主流存儲(chǔ)芯片品類真正的市場(chǎng)機(jī)會(huì)。
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4791瀏覽量
90058 -
DeepSeek
+關(guān)注
關(guān)注
2文章
835瀏覽量
3262
發(fā)布評(píng)論請(qǐng)先 登錄
寒武紀(jì)“炸裂”財(cái)報(bào)!一季度營(yíng)收增長(zhǎng)40倍,積極備貨應(yīng)對(duì)“爆單”?
寒武紀(jì)實(shí)現(xiàn)對(duì)GLM-5的Day 0適配
寒武紀(jì)引領(lǐng)AI芯片軟件新生態(tài)
商湯科技與寒武紀(jì)達(dá)成戰(zhàn)略合作
寒武紀(jì)成功適配DeepSeek-V3.2-Exp模型
寒武紀(jì)股價(jià)破1200大關(guān)創(chuàng)歷史新高 DeepSeek適配國(guó)產(chǎn)芯片成直接原因
寒武紀(jì)85后創(chuàng)始人陳天石身價(jià)超1500億
邊緣計(jì)算AI硬件如何接入DeepSeek嗎?需要具備哪些條件?
寒武紀(jì)聯(lián)手階躍星辰成立模芯生態(tài)創(chuàng)新聯(lián)盟
寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊(cè)詳解
寒武紀(jì)思元370芯片參數(shù)特性詳解
寒武紀(jì)一季度營(yíng)收大漲4230% 凈利潤(rùn)3.55億 扭虧為盈
Deepseek橫空出世!中美AI之間的差距逆轉(zhuǎn)了嗎?
DeepSeek在昇騰上的模型部署的常見問題及解決方案
DeepSeek橫空出世,存儲(chǔ)產(chǎn)業(yè)的寒武紀(jì)大爆發(fā)來(lái)了
評(píng)論