電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆收購。但英偉達(dá)回應(yīng)表示,并未計(jì)劃收購Groq,僅達(dá)成技術(shù)許可合作,將采用Groq的推理技術(shù)。
隨后,Groq公司宣布已與英偉達(dá)就其推理技術(shù)達(dá)成非獨(dú)家許可協(xié)議。根據(jù)協(xié)議條款,Groq創(chuàng)始人喬納森·羅斯(Jonathan Ross)、總裁桑尼·馬達(dá)拉(Sunny Madra)及其他核心團(tuán)隊(duì)成員將加入英偉達(dá),共同推進(jìn)授權(quán)技術(shù)的升級(jí)與規(guī)模化應(yīng)用。此外,Groq將繼續(xù)作為獨(dú)立公司運(yùn)營,西蒙·愛德華茲(Simon Edwards)將接任首席執(zhí)行官職務(wù);Groq云服務(wù)將保持正常運(yùn)行,不受此次合作影響。
Groq成立于2016年,總部位于美國加利福尼亞州山景城,是一家AI推理芯片廠商。該公司核心團(tuán)隊(duì)源自谷歌最初的張量處理單元(TPU)工程團(tuán)隊(duì),創(chuàng)始人兼前CEO喬納森·羅斯(Jonathan Ross)是谷歌TPU項(xiàng)目的核心研發(fā)人員。
2024年8月,Groq在最新一輪融資中籌集6.4億美元,由貝萊德集團(tuán)(BlackRock Inc.)基金領(lǐng)投,并獲得思科和三星投資部門的支持。2024年12月,Groq在沙特阿拉伯達(dá)曼建成中東地區(qū)最大的推理集群,該集群包含19000個(gè)Groq LPU,僅用8天便完成上線。
2025年2月,Groq從沙特阿拉伯成功籌集15億美元融資,用于擴(kuò)建其在當(dāng)?shù)氐腁I基礎(chǔ)設(shè)施;9月,完成7.5億美元融資,投后估值達(dá)69億美元,累計(jì)融資額超30億美元。
Groq公司研發(fā)的語言處理單元(Language Processing Unit,簡(jiǎn)稱LPU),憑借獨(dú)特架構(gòu)展現(xiàn)出極高的推理性能,是一款典型的近存計(jì)算芯片。
該芯片采用14nm制程,搭載230MB SRAM以保障內(nèi)存帶寬,片上內(nèi)存帶寬達(dá)80TB/s。SRAM的訪問速度遠(yuǎn)快于DRAM,使其在計(jì)算密集型應(yīng)用中表現(xiàn)突出;而大容量SRAM的配置,有助于提升機(jī)器學(xué)習(xí)、人工智能等計(jì)算密集型工作負(fù)載的處理效率。
靜態(tài)隨機(jī)存取存儲(chǔ)器(Static Random-Access Memory,簡(jiǎn)稱SRAM)是隨機(jī)存取存儲(chǔ)器的一種,只要保持通電,存儲(chǔ)的數(shù)據(jù)就能持續(xù)保留;相比之下,動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)存儲(chǔ)的數(shù)據(jù)需周期性刷新。但需注意,SRAM仍屬于易失性存儲(chǔ)器,斷電后數(shù)據(jù)會(huì)丟失,這與斷電后仍能保存數(shù)據(jù)的ROM(只讀存儲(chǔ)器)或閃存存在本質(zhì)區(qū)別。
SRAM雖性能優(yōu)越,但也存在明顯短板:集成度較低、功耗高于DRAM,且單位容量占用硅片面積更大。同等面積的硅片可制造更大容量的DRAM,因此SRAM成本更高。基于其高速響應(yīng)的特性,SRAM常被用作CPU與主存之間的高速緩存,無需定期刷新,可適配CPU一級(jí)緩存、二級(jí)緩存等場(chǎng)景。
當(dāng)前,全球AI產(chǎn)業(yè)隨著模型訓(xùn)練逐步收斂,正邁向大規(guī)模推理應(yīng)用落地階段。英偉達(dá)通過“技術(shù)授權(quán)+核心人才引進(jìn)”的模式,可快速補(bǔ)強(qiáng)AI推理領(lǐng)域的布局,鞏固其全棧AI優(yōu)勢(shì)。這一合作有望帶動(dòng)AI產(chǎn)業(yè)進(jìn)入下一發(fā)展階段,掀起AI推理熱潮。
Axelera的AIPU芯片采用創(chuàng)新的內(nèi)存計(jì)算技術(shù)。與傳統(tǒng)磁盤存儲(chǔ)相比,內(nèi)存計(jì)算將數(shù)據(jù)直接存儲(chǔ)在主內(nèi)存(RAM)中,大幅提升數(shù)據(jù)處理速度。該芯片融合SRAM(靜態(tài)隨機(jī)訪問存儲(chǔ)器)與數(shù)字計(jì)算技術(shù),使每個(gè)存儲(chǔ)單元可直接作為計(jì)算單元,從根本上增加了每個(gè)計(jì)算機(jī)周期的操作數(shù)(每個(gè)存儲(chǔ)單元每周期可完成一次乘法和一次累加),且不受噪聲干擾或精度降低等問題影響。
這一技術(shù)讓Axelera芯片在提供高計(jì)算性能的同時(shí),能夠以更低成本、更低能耗完成邊緣AI計(jì)算任務(wù)。此外,該芯片采用開源的RISC-V指令集架構(gòu)(ISA),其低成本、高效能、高靈活性的特性,可支持根據(jù)特定應(yīng)用需求進(jìn)行定制化設(shè)計(jì),為Axelera帶來極大的設(shè)計(jì)自由度與創(chuàng)新空間。
2024年,Axelera獲得三星電子風(fēng)險(xiǎn)投資部門三星催化劑基金(Samsung Catalyst)的大力支持,成功籌集6800萬美元融資,至此總?cè)谫Y額達(dá)到1.2億美元。
AI芯片初創(chuàng)公司EnCharge AI研發(fā)出一種新型內(nèi)存計(jì)算架構(gòu),專為AI推理場(chǎng)景設(shè)計(jì)。其核心技術(shù)是基于模擬存內(nèi)計(jì)算的AI芯片,該創(chuàng)新設(shè)計(jì)采用“基于電荷的存儲(chǔ)器”,通過讀取存儲(chǔ)平面上的電流而非單個(gè)比特單元處理數(shù)據(jù),并使用更精確的電容器替代傳統(tǒng)半導(dǎo)體器件。
此外,d-Matrix采用數(shù)字內(nèi)存計(jì)算(DIMC)引擎架構(gòu),將計(jì)算單元遷移至RAM(內(nèi)存)附近;該數(shù)字存算一體技術(shù)通過合并存儲(chǔ)器與計(jì)算單元中的乘法累加器(MAC),顯著提升計(jì)算帶寬與效率,同時(shí)降低延遲、減少能耗。
在國內(nèi),知存科技、昕原半導(dǎo)體、九天睿芯、恒爍股份等企業(yè)均在積極布局存儲(chǔ)與計(jì)算融合的AI存算一體芯片領(lǐng)域。
昕原半導(dǎo)體的ATOM(AI Thruster Optimized Memory)產(chǎn)品系列,利用ReRAM(阻變存儲(chǔ)器)兼容先進(jìn)工藝的特性,將存儲(chǔ)單元與計(jì)算單元融為一體,相比傳統(tǒng)方案實(shí)現(xiàn)數(shù)十倍的帶寬、性能及能效比提升。ATOM的存儲(chǔ)容量與算力均支持靈活配置,是端側(cè)、邊緣側(cè)及云端大模型加速的理想解決方案。
知存科技作為全球最早布局存算一體技術(shù)的企業(yè)之一,已實(shí)現(xiàn)技術(shù)量產(chǎn)商用,并積累了豐富的客戶服務(wù)經(jīng)驗(yàn)。知存科技CEO王紹迪表示,AI技術(shù)從云端向端邊側(cè)滲透是明確趨勢(shì),但帶寬、成本等痛點(diǎn)亟待解決,這推動(dòng)半導(dǎo)體行業(yè)向“高帶寬、低成本、高能效”的技術(shù)方向創(chuàng)新,而存算一體技術(shù)正是契合這一需求的關(guān)鍵路徑。
知存科技早早就洞察到存算一體技術(shù)在端側(cè)AI場(chǎng)景的優(yōu)勢(shì),2024年啟動(dòng)“天才博士計(jì)劃”吸納全球頂尖人才,并與北京大學(xué)、清華大學(xué)等高校共建聯(lián)合實(shí)驗(yàn)室,持續(xù)深耕技術(shù)突破。近兩年來,知存科技營收平均增速超50%,2025年市場(chǎng)表現(xiàn)亮眼,預(yù)計(jì)2026年將實(shí)現(xiàn)更高增長;累計(jì)服務(wù)客戶超30家,存算一體芯片的市場(chǎng)應(yīng)用規(guī)模持續(xù)擴(kuò)大,成功響應(yīng)AI眼鏡、AI相機(jī)等細(xì)分領(lǐng)域的高能效計(jì)算需求,技術(shù)認(rèn)可度與商業(yè)落地能力得到行業(yè)進(jìn)一步驗(yàn)證。
九天睿芯專注于多層級(jí)存算融合的技術(shù)路徑,通過整合存算一體與近存計(jì)算技術(shù),實(shí)現(xiàn)前沿技術(shù)研發(fā)與商業(yè)化落地,為AI計(jì)算提供超高性能、更大容量、更低功耗的新一代硬件解決方案。目前,其芯片產(chǎn)品已在多家客戶實(shí)現(xiàn)量產(chǎn),并獲得多個(gè)國際一線智能眼鏡、智能耳機(jī)及助聽器品牌的訂單。2025年9月,九天睿芯宣布完成超億元B輪融資。
九天睿芯創(chuàng)始人、董事長兼CEO劉洪杰表示,公司計(jì)劃未來3年內(nèi)加速后續(xù)兩代大容量大算力存算一體芯片的研發(fā)進(jìn)程:第二代芯片期間版本將支持1~3B級(jí)別的輕量化大模型,目前已流片成功;第三代芯片將支持100B(千億)級(jí)別參數(shù)量大模型的推理部署,成本僅為當(dāng)前方案的十分之一,相當(dāng)于現(xiàn)有支持5~10B(百億)級(jí)別參數(shù)量模型推理芯片的成本水平。
恒爍股份表示,公司研發(fā)的低功耗存算一體推理技術(shù),可高效完成AI核心計(jì)算任務(wù)——向量矩陣乘法。借助存算一體技術(shù),芯片能夠規(guī)避計(jì)算過程中模型數(shù)據(jù)訪存帶來的“存儲(chǔ)墻”問題,提升計(jì)算能效與計(jì)算面效,進(jìn)而降低計(jì)算功耗與芯片面積。目前,公司已具備基于Nor Flash和SRAM兩種介質(zhì)的存算一體技術(shù),覆蓋模擬存內(nèi)計(jì)算和數(shù)字存內(nèi)計(jì)算兩種技術(shù)路徑,可根據(jù)應(yīng)用場(chǎng)景需求選擇適配的計(jì)算介質(zhì)與路徑。
此外,恒爍股份在音頻應(yīng)用領(lǐng)域研發(fā)了與存算技術(shù)配套的低功耗預(yù)處理技術(shù),包括低功耗ADC(模數(shù)轉(zhuǎn)換器)設(shè)計(jì)、低功耗人聲活動(dòng)檢測(cè)(VAD)及低功耗FFT(快速傅里葉變換)等。該預(yù)處理技術(shù)與存算一體計(jì)算核心搭配,可從系統(tǒng)層面優(yōu)化智能語音芯片的實(shí)際功耗,推動(dòng)存算一體技術(shù)從單一模塊的技術(shù)優(yōu)勢(shì),轉(zhuǎn)化為可落地、具備性價(jià)比與競(jìng)爭(zhēng)力的芯片產(chǎn)品。
隨后,Groq公司宣布已與英偉達(dá)就其推理技術(shù)達(dá)成非獨(dú)家許可協(xié)議。根據(jù)協(xié)議條款,Groq創(chuàng)始人喬納森·羅斯(Jonathan Ross)、總裁桑尼·馬達(dá)拉(Sunny Madra)及其他核心團(tuán)隊(duì)成員將加入英偉達(dá),共同推進(jìn)授權(quán)技術(shù)的升級(jí)與規(guī)模化應(yīng)用。此外,Groq將繼續(xù)作為獨(dú)立公司運(yùn)營,西蒙·愛德華茲(Simon Edwards)將接任首席執(zhí)行官職務(wù);Groq云服務(wù)將保持正常運(yùn)行,不受此次合作影響。
Groq成立于2016年,總部位于美國加利福尼亞州山景城,是一家AI推理芯片廠商。該公司核心團(tuán)隊(duì)源自谷歌最初的張量處理單元(TPU)工程團(tuán)隊(duì),創(chuàng)始人兼前CEO喬納森·羅斯(Jonathan Ross)是谷歌TPU項(xiàng)目的核心研發(fā)人員。
2024年8月,Groq在最新一輪融資中籌集6.4億美元,由貝萊德集團(tuán)(BlackRock Inc.)基金領(lǐng)投,并獲得思科和三星投資部門的支持。2024年12月,Groq在沙特阿拉伯達(dá)曼建成中東地區(qū)最大的推理集群,該集群包含19000個(gè)Groq LPU,僅用8天便完成上線。
2025年2月,Groq從沙特阿拉伯成功籌集15億美元融資,用于擴(kuò)建其在當(dāng)?shù)氐腁I基礎(chǔ)設(shè)施;9月,完成7.5億美元融資,投后估值達(dá)69億美元,累計(jì)融資額超30億美元。
Groq LPU近存計(jì)算芯片
AI推理的廣泛應(yīng)用是AI普惠大眾的關(guān)鍵,業(yè)內(nèi)巨頭與初創(chuàng)公司均洞察到其發(fā)展前景并提前布局,Groq便是其中的佼佼者。其AI推理芯片采用SRAM替代DRAM,從而實(shí)現(xiàn)更快的訪問速度、更低的刷新延遲等優(yōu)勢(shì)。Groq公司研發(fā)的語言處理單元(Language Processing Unit,簡(jiǎn)稱LPU),憑借獨(dú)特架構(gòu)展現(xiàn)出極高的推理性能,是一款典型的近存計(jì)算芯片。
該芯片采用14nm制程,搭載230MB SRAM以保障內(nèi)存帶寬,片上內(nèi)存帶寬達(dá)80TB/s。SRAM的訪問速度遠(yuǎn)快于DRAM,使其在計(jì)算密集型應(yīng)用中表現(xiàn)突出;而大容量SRAM的配置,有助于提升機(jī)器學(xué)習(xí)、人工智能等計(jì)算密集型工作負(fù)載的處理效率。
靜態(tài)隨機(jī)存取存儲(chǔ)器(Static Random-Access Memory,簡(jiǎn)稱SRAM)是隨機(jī)存取存儲(chǔ)器的一種,只要保持通電,存儲(chǔ)的數(shù)據(jù)就能持續(xù)保留;相比之下,動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)存儲(chǔ)的數(shù)據(jù)需周期性刷新。但需注意,SRAM仍屬于易失性存儲(chǔ)器,斷電后數(shù)據(jù)會(huì)丟失,這與斷電后仍能保存數(shù)據(jù)的ROM(只讀存儲(chǔ)器)或閃存存在本質(zhì)區(qū)別。
SRAM雖性能優(yōu)越,但也存在明顯短板:集成度較低、功耗高于DRAM,且單位容量占用硅片面積更大。同等面積的硅片可制造更大容量的DRAM,因此SRAM成本更高。基于其高速響應(yīng)的特性,SRAM常被用作CPU與主存之間的高速緩存,無需定期刷新,可適配CPU一級(jí)緩存、二級(jí)緩存等場(chǎng)景。
當(dāng)前,全球AI產(chǎn)業(yè)隨著模型訓(xùn)練逐步收斂,正邁向大規(guī)模推理應(yīng)用落地階段。英偉達(dá)通過“技術(shù)授權(quán)+核心人才引進(jìn)”的模式,可快速補(bǔ)強(qiáng)AI推理領(lǐng)域的布局,鞏固其全棧AI優(yōu)勢(shì)。這一合作有望帶動(dòng)AI產(chǎn)業(yè)進(jìn)入下一發(fā)展階段,掀起AI推理熱潮。
國內(nèi)外AI推理存儲(chǔ)布局
結(jié)合AI推理應(yīng)用場(chǎng)景的特性,基于多種存儲(chǔ)類型的AI推理芯片、存算一體芯片在存儲(chǔ)與計(jì)算產(chǎn)業(yè)界備受關(guān)注、活躍度極高。筆者在先前撰寫的《AI推理的存儲(chǔ),看好SRAM?》一文中曾提及,除Groq LPU近存計(jì)算芯片外,國內(nèi)外多家企業(yè)也推出了同類相關(guān)產(chǎn)品。Axelera的AIPU芯片采用創(chuàng)新的內(nèi)存計(jì)算技術(shù)。與傳統(tǒng)磁盤存儲(chǔ)相比,內(nèi)存計(jì)算將數(shù)據(jù)直接存儲(chǔ)在主內(nèi)存(RAM)中,大幅提升數(shù)據(jù)處理速度。該芯片融合SRAM(靜態(tài)隨機(jī)訪問存儲(chǔ)器)與數(shù)字計(jì)算技術(shù),使每個(gè)存儲(chǔ)單元可直接作為計(jì)算單元,從根本上增加了每個(gè)計(jì)算機(jī)周期的操作數(shù)(每個(gè)存儲(chǔ)單元每周期可完成一次乘法和一次累加),且不受噪聲干擾或精度降低等問題影響。
這一技術(shù)讓Axelera芯片在提供高計(jì)算性能的同時(shí),能夠以更低成本、更低能耗完成邊緣AI計(jì)算任務(wù)。此外,該芯片采用開源的RISC-V指令集架構(gòu)(ISA),其低成本、高效能、高靈活性的特性,可支持根據(jù)特定應(yīng)用需求進(jìn)行定制化設(shè)計(jì),為Axelera帶來極大的設(shè)計(jì)自由度與創(chuàng)新空間。
2024年,Axelera獲得三星電子風(fēng)險(xiǎn)投資部門三星催化劑基金(Samsung Catalyst)的大力支持,成功籌集6800萬美元融資,至此總?cè)谫Y額達(dá)到1.2億美元。
AI芯片初創(chuàng)公司EnCharge AI研發(fā)出一種新型內(nèi)存計(jì)算架構(gòu),專為AI推理場(chǎng)景設(shè)計(jì)。其核心技術(shù)是基于模擬存內(nèi)計(jì)算的AI芯片,該創(chuàng)新設(shè)計(jì)采用“基于電荷的存儲(chǔ)器”,通過讀取存儲(chǔ)平面上的電流而非單個(gè)比特單元處理數(shù)據(jù),并使用更精確的電容器替代傳統(tǒng)半導(dǎo)體器件。
此外,d-Matrix采用數(shù)字內(nèi)存計(jì)算(DIMC)引擎架構(gòu),將計(jì)算單元遷移至RAM(內(nèi)存)附近;該數(shù)字存算一體技術(shù)通過合并存儲(chǔ)器與計(jì)算單元中的乘法累加器(MAC),顯著提升計(jì)算帶寬與效率,同時(shí)降低延遲、減少能耗。
在國內(nèi),知存科技、昕原半導(dǎo)體、九天睿芯、恒爍股份等企業(yè)均在積極布局存儲(chǔ)與計(jì)算融合的AI存算一體芯片領(lǐng)域。
昕原半導(dǎo)體的ATOM(AI Thruster Optimized Memory)產(chǎn)品系列,利用ReRAM(阻變存儲(chǔ)器)兼容先進(jìn)工藝的特性,將存儲(chǔ)單元與計(jì)算單元融為一體,相比傳統(tǒng)方案實(shí)現(xiàn)數(shù)十倍的帶寬、性能及能效比提升。ATOM的存儲(chǔ)容量與算力均支持靈活配置,是端側(cè)、邊緣側(cè)及云端大模型加速的理想解決方案。
知存科技作為全球最早布局存算一體技術(shù)的企業(yè)之一,已實(shí)現(xiàn)技術(shù)量產(chǎn)商用,并積累了豐富的客戶服務(wù)經(jīng)驗(yàn)。知存科技CEO王紹迪表示,AI技術(shù)從云端向端邊側(cè)滲透是明確趨勢(shì),但帶寬、成本等痛點(diǎn)亟待解決,這推動(dòng)半導(dǎo)體行業(yè)向“高帶寬、低成本、高能效”的技術(shù)方向創(chuàng)新,而存算一體技術(shù)正是契合這一需求的關(guān)鍵路徑。
知存科技早早就洞察到存算一體技術(shù)在端側(cè)AI場(chǎng)景的優(yōu)勢(shì),2024年啟動(dòng)“天才博士計(jì)劃”吸納全球頂尖人才,并與北京大學(xué)、清華大學(xué)等高校共建聯(lián)合實(shí)驗(yàn)室,持續(xù)深耕技術(shù)突破。近兩年來,知存科技營收平均增速超50%,2025年市場(chǎng)表現(xiàn)亮眼,預(yù)計(jì)2026年將實(shí)現(xiàn)更高增長;累計(jì)服務(wù)客戶超30家,存算一體芯片的市場(chǎng)應(yīng)用規(guī)模持續(xù)擴(kuò)大,成功響應(yīng)AI眼鏡、AI相機(jī)等細(xì)分領(lǐng)域的高能效計(jì)算需求,技術(shù)認(rèn)可度與商業(yè)落地能力得到行業(yè)進(jìn)一步驗(yàn)證。
九天睿芯專注于多層級(jí)存算融合的技術(shù)路徑,通過整合存算一體與近存計(jì)算技術(shù),實(shí)現(xiàn)前沿技術(shù)研發(fā)與商業(yè)化落地,為AI計(jì)算提供超高性能、更大容量、更低功耗的新一代硬件解決方案。目前,其芯片產(chǎn)品已在多家客戶實(shí)現(xiàn)量產(chǎn),并獲得多個(gè)國際一線智能眼鏡、智能耳機(jī)及助聽器品牌的訂單。2025年9月,九天睿芯宣布完成超億元B輪融資。
九天睿芯創(chuàng)始人、董事長兼CEO劉洪杰表示,公司計(jì)劃未來3年內(nèi)加速后續(xù)兩代大容量大算力存算一體芯片的研發(fā)進(jìn)程:第二代芯片期間版本將支持1~3B級(jí)別的輕量化大模型,目前已流片成功;第三代芯片將支持100B(千億)級(jí)別參數(shù)量大模型的推理部署,成本僅為當(dāng)前方案的十分之一,相當(dāng)于現(xiàn)有支持5~10B(百億)級(jí)別參數(shù)量模型推理芯片的成本水平。
恒爍股份表示,公司研發(fā)的低功耗存算一體推理技術(shù),可高效完成AI核心計(jì)算任務(wù)——向量矩陣乘法。借助存算一體技術(shù),芯片能夠規(guī)避計(jì)算過程中模型數(shù)據(jù)訪存帶來的“存儲(chǔ)墻”問題,提升計(jì)算能效與計(jì)算面效,進(jìn)而降低計(jì)算功耗與芯片面積。目前,公司已具備基于Nor Flash和SRAM兩種介質(zhì)的存算一體技術(shù),覆蓋模擬存內(nèi)計(jì)算和數(shù)字存內(nèi)計(jì)算兩種技術(shù)路徑,可根據(jù)應(yīng)用場(chǎng)景需求選擇適配的計(jì)算介質(zhì)與路徑。
此外,恒爍股份在音頻應(yīng)用領(lǐng)域研發(fā)了與存算技術(shù)配套的低功耗預(yù)處理技術(shù),包括低功耗ADC(模數(shù)轉(zhuǎn)換器)設(shè)計(jì)、低功耗人聲活動(dòng)檢測(cè)(VAD)及低功耗FFT(快速傅里葉變換)等。該預(yù)處理技術(shù)與存算一體計(jì)算核心搭配,可從系統(tǒng)層面優(yōu)化智能語音芯片的實(shí)際功耗,推動(dòng)存算一體技術(shù)從單一模塊的技術(shù)優(yōu)勢(shì),轉(zhuǎn)化為可落地、具備性價(jià)比與競(jìng)爭(zhēng)力的芯片產(chǎn)品。
小結(jié)
綜上可見,存算一體方案能夠有效提升推理效率、降低推理成本,推動(dòng)AI推理進(jìn)入規(guī)模化落地階段。更低成本的推理方案將讓更多企業(yè)具備接入大模型的能力,進(jìn)一步加速AI在內(nèi)容生成、數(shù)據(jù)分析、端側(cè)智能等領(lǐng)域的普及應(yīng)用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301386 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4087瀏覽量
99177
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
高通挑戰(zhàn)英偉達(dá),發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心
億美元的數(shù)據(jù)中心市場(chǎng)中搶占一席之地。 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI 推理
高通挑戰(zhàn)英偉達(dá)!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心
億美元的數(shù)據(jù)中心市場(chǎng)中搶占一席之地。 ? 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI 推
堪稱史上最強(qiáng)推理芯片!英偉達(dá)發(fā)布 Rubin CPX,實(shí)現(xiàn)50倍ROI
電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近日,英偉達(dá)在AI infra峰會(huì)上發(fā)布了專為大規(guī)模上下文推理設(shè)計(jì)的全新GPU系列Rubin CPX,性能堪稱炸裂! ?
AI推理需求井噴!英偉達(dá)Q1營收大漲,H20禁售難擋增長步伐
電子發(fā)燒友原創(chuàng) 章鷹 在中美科技企業(yè)爭(zhēng)奪人工智能高地的競(jìng)爭(zhēng)中,處于第一方陣的美國AI芯片公司英偉達(dá)公司最新交出了讓市場(chǎng)滿意的答卷。 5月28日,英偉
從英偉達(dá)電話會(huì)看Agentic AI推理與FPGA價(jià)值
2026年2月,英偉達(dá)發(fā)布2026財(cái)年Q4財(cái)報(bào):營收681億美元,同比增長73%,數(shù)據(jù)中心業(yè)務(wù)增長75%——預(yù)期中的超預(yù)期。更值得關(guān)注的,是電話會(huì)中反復(fù)出現(xiàn)的幾個(gè)關(guān)鍵詞:Agentic AI、
AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴
電子發(fā)燒友網(wǎng)綜合報(bào)道,在人工智能迅猛發(fā)展的當(dāng)下,AI推理芯片需求正呈爆發(fā)式增長。 ? AI推理,即支撐如ChatGPT這類AI模型響應(yīng)用戶問
美對(duì)華芯片出口“松綁”:英偉達(dá)H200獲準(zhǔn)進(jìn)入中國市場(chǎng)#AI芯片#英偉達(dá)#H200芯片
英偉達(dá)
jf_15747056
發(fā)布于 :2026年01月14日 18:39:59
第四次工業(yè)革命AI將實(shí)現(xiàn)十億倍增長 | 中國AI芯片與英偉達(dá)的角色
內(nèi)容提要:黃仁勛BG2專訪:英偉達(dá)、OpenAI、算力未來與美國夢(mèng)AI規(guī)模定律與推理的革命:在傳統(tǒng)的AI規(guī)模定律(預(yù)訓(xùn)練、后訓(xùn)練)之上,引入
英偉達(dá)AI人才,去了華為
電子發(fā)燒友網(wǎng)綜合報(bào)道 近日,英偉達(dá)首席科學(xué)家比爾·戴利(Bill Dally)表示,美國對(duì)中國實(shí)施的人工智能出口管制禁令,讓中國獲得很大的發(fā)展空間,過去替英偉達(dá)撰寫程序的中國人工智能研
曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案
近日,曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案,秉持“AI加速”理念,面向AI訓(xùn)練、AI
英偉達(dá)Cosmos-Reason1 模型深度解讀
英偉達(dá)近期發(fā)布的 Cosmos-Reason1 模型在物理常識(shí)推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專為物理世界交互設(shè)計(jì)的多模態(tài)大語言模型,它通過融合視覺感知與復(fù)雜邏輯推理,重新定義了
IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新
近日,IBM(紐約證券交易所:IBM)宣布與英偉達(dá)(納斯達(dá)克股票代碼:NVDA)開展全新合作,雙方將基于英偉達(dá) AI 數(shù)據(jù)平臺(tái)參考架構(gòu)(re
發(fā)表于 03-24 19:20
?515次閱讀
英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代
英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代
英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型
DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴(kuò)展 AI 工廠中的 AI 推理模型。 作
新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率
B200 Blackwell架構(gòu),新思科技 Proteus預(yù)計(jì)將計(jì)算光刻仿真的速度提升達(dá)20倍 英偉達(dá)NIM推理微服務(wù)集成將生成式AI驅(qū)動(dòng)的
發(fā)表于 03-19 17:59
?493次閱讀
英偉達(dá)重磅出手!AI 推理存儲(chǔ)全面覺醒
評(píng)論