伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達重磅出手!AI 推理存儲全面覺醒

晶芯觀察 ? 來源:電子發燒友網 ? 作者:黃晶晶 ? 2025-12-26 08:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/黃晶晶)近日,有消息稱,英偉達將以大約200億美元收購人工智能芯片初創公司Groq,這將是英偉達迄今為止規模最大的一筆收購。但英偉達回應表示,并未計劃收購Groq,僅達成技術許可合作,將采用Groq的推理技術。

隨后,Groq公司宣布已與英偉達就其推理技術達成非獨家許可協議。根據協議條款,Groq創始人喬納森·羅斯(Jonathan Ross)、總裁桑尼·馬達拉(Sunny Madra)及其他核心團隊成員將加入英偉達,共同推進授權技術的升級與規模化應用。此外,Groq將繼續作為獨立公司運營,西蒙·愛德華茲(Simon Edwards)將接任首席執行官職務;Groq云服務將保持正常運行,不受此次合作影響。

Groq成立于2016年,總部位于美國加利福尼亞州山景城,是一家AI推理芯片廠商。該公司核心團隊源自谷歌最初的張量處理單元(TPU)工程團隊,創始人兼前CEO喬納森·羅斯(Jonathan Ross)是谷歌TPU項目的核心研發人員。

2024年8月,Groq在最新一輪融資中籌集6.4億美元,由貝萊德集團(BlackRock Inc.)基金領投,并獲得思科和三星投資部門的支持。2024年12月,Groq在沙特阿拉伯達曼建成中東地區最大的推理集群,該集群包含19000個Groq LPU,僅用8天便完成上線。

2025年2月,Groq從沙特阿拉伯成功籌集15億美元融資,用于擴建其在當地的AI基礎設施;9月,完成7.5億美元融資,投后估值達69億美元,累計融資額超30億美元。

Groq LPU近存計算芯片

AI推理的廣泛應用是AI普惠大眾的關鍵,業內巨頭與初創公司均洞察到其發展前景并提前布局,Groq便是其中的佼佼者。其AI推理芯片采用SRAM替代DRAM,從而實現更快的訪問速度、更低的刷新延遲等優勢。

Groq公司研發的語言處理單元(Language Processing Unit,簡稱LPU),憑借獨特架構展現出極高的推理性能,是一款典型的近存計算芯片。

該芯片采用14nm制程,搭載230MB SRAM以保障內存帶寬,片上內存帶寬達80TB/s。SRAM的訪問速度遠快于DRAM,使其在計算密集型應用中表現突出;而大容量SRAM的配置,有助于提升機器學習、人工智能等計算密集型工作負載的處理效率。

靜態隨機存取存儲器(Static Random-Access Memory,簡稱SRAM)是隨機存取存儲器的一種,只要保持通電,存儲的數據就能持續保留;相比之下,動態隨機存取存儲器(DRAM)存儲的數據需周期性刷新。但需注意,SRAM仍屬于易失性存儲器,斷電后數據會丟失,這與斷電后仍能保存數據的ROM(只讀存儲器)或閃存存在本質區別。

SRAM雖性能優越,但也存在明顯短板:集成度較低、功耗高于DRAM,且單位容量占用硅片面積更大。同等面積的硅片可制造更大容量的DRAM,因此SRAM成本更高。基于其高速響應的特性,SRAM常被用作CPU與主存之間的高速緩存,無需定期刷新,可適配CPU一級緩存、二級緩存等場景。

當前,全球AI產業隨著模型訓練逐步收斂,正邁向大規模推理應用落地階段。英偉達通過“技術授權+核心人才引進”的模式,可快速補強AI推理領域的布局,鞏固其全棧AI優勢。這一合作有望帶動AI產業進入下一發展階段,掀起AI推理熱潮。

國內外AI推理存儲布局

結合AI推理應用場景的特性,基于多種存儲類型的AI推理芯片、存算一體芯片在存儲與計算產業界備受關注、活躍度極高。筆者在先前撰寫的《AI推理的存儲,看好SRAM?》一文中曾提及,除Groq LPU近存計算芯片外,國內外多家企業也推出了同類相關產品。

Axelera的AIPU芯片采用創新的內存計算技術。與傳統磁盤存儲相比,內存計算將數據直接存儲在主內存(RAM)中,大幅提升數據處理速度。該芯片融合SRAM(靜態隨機訪問存儲器)與數字計算技術,使每個存儲單元可直接作為計算單元,從根本上增加了每個計算機周期的操作數(每個存儲單元每周期可完成一次乘法和一次累加),且不受噪聲干擾或精度降低等問題影響。

這一技術讓Axelera芯片在提供高計算性能的同時,能夠以更低成本、更低能耗完成邊緣AI計算任務。此外,該芯片采用開源的RISC-V指令集架構(ISA),其低成本、高效能、高靈活性的特性,可支持根據特定應用需求進行定制化設計,為Axelera帶來極大的設計自由度與創新空間。

2024年,Axelera獲得三星電子風險投資部門三星催化劑基金(Samsung Catalyst)的大力支持,成功籌集6800萬美元融資,至此總融資額達到1.2億美元。

AI芯片初創公司EnCharge AI研發出一種新型內存計算架構,專為AI推理場景設計。其核心技術是基于模擬存內計算的AI芯片,該創新設計采用“基于電荷的存儲器”,通過讀取存儲平面上的電流而非單個比特單元處理數據,并使用更精確的電容器替代傳統半導體器件。

此外,d-Matrix采用數字內存計算(DIMC)引擎架構,將計算單元遷移至RAM(內存)附近;該數字存算一體技術通過合并存儲器與計算單元中的乘法累加器(MAC),顯著提升計算帶寬與效率,同時降低延遲、減少能耗。
在國內,知存科技、昕原半導體、九天睿芯、恒爍股份等企業均在積極布局存儲與計算融合的AI存算一體芯片領域。

昕原半導體的ATOM(AI Thruster Optimized Memory)產品系列,利用ReRAM(阻變存儲器)兼容先進工藝的特性,將存儲單元與計算單元融為一體,相比傳統方案實現數十倍的帶寬、性能及能效比提升。ATOM的存儲容量與算力均支持靈活配置,是端側、邊緣側及云端大模型加速的理想解決方案。

知存科技作為全球最早布局存算一體技術的企業之一,已實現技術量產商用,并積累了豐富的客戶服務經驗。知存科技CEO王紹迪表示,AI技術從云端向端邊側滲透是明確趨勢,但帶寬、成本等痛點亟待解決,這推動半導體行業向“高帶寬、低成本、高能效”的技術方向創新,而存算一體技術正是契合這一需求的關鍵路徑。

知存科技早早就洞察到存算一體技術在端側AI場景的優勢,2024年啟動“天才博士計劃”吸納全球頂尖人才,并與北京大學、清華大學等高校共建聯合實驗室,持續深耕技術突破。近兩年來,知存科技營收平均增速超50%,2025年市場表現亮眼,預計2026年將實現更高增長;累計服務客戶超30家,存算一體芯片的市場應用規模持續擴大,成功響應AI眼鏡、AI相機等細分領域的高能效計算需求,技術認可度與商業落地能力得到行業進一步驗證。

九天睿芯專注于多層級存算融合的技術路徑,通過整合存算一體與近存計算技術,實現前沿技術研發與商業化落地,為AI計算提供超高性能、更大容量、更低功耗的新一代硬件解決方案。目前,其芯片產品已在多家客戶實現量產,并獲得多個國際一線智能眼鏡、智能耳機及助聽器品牌的訂單。2025年9月,九天睿芯宣布完成超億元B輪融資。

九天睿芯創始人、董事長兼CEO劉洪杰表示,公司計劃未來3年內加速后續兩代大容量大算力存算一體芯片的研發進程:第二代芯片期間版本將支持1~3B級別的輕量化大模型,目前已流片成功;第三代芯片將支持100B(千億)級別參數量大模型的推理部署,成本僅為當前方案的十分之一,相當于現有支持5~10B(百億)級別參數量模型推理芯片的成本水平。

恒爍股份表示,公司研發的低功耗存算一體推理技術,可高效完成AI核心計算任務——向量矩陣乘法。借助存算一體技術,芯片能夠規避計算過程中模型數據訪存帶來的“存儲墻”問題,提升計算能效與計算面效,進而降低計算功耗與芯片面積。目前,公司已具備基于Nor Flash和SRAM兩種介質的存算一體技術,覆蓋模擬存內計算和數字存內計算兩種技術路徑,可根據應用場景需求選擇適配的計算介質與路徑。

此外,恒爍股份在音頻應用領域研發了與存算技術配套的低功耗預處理技術,包括低功耗ADC模數轉換器)設計、低功耗人聲活動檢測(VAD)及低功耗FFT(快速傅里葉變換)等。該預處理技術與存算一體計算核心搭配,可從系統層面優化智能語音芯片的實際功耗,推動存算一體技術從單一模塊的技術優勢,轉化為可落地、具備性價比與競爭力的芯片產品。

小結

綜上可見,存算一體方案能夠有效提升推理效率、降低推理成本,推動AI推理進入規模化落地階段。更低成本的推理方案將讓更多企業具備接入大模型的能力,進一步加速AI在內容生成、數據分析、端側智能等領域的普及應用。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40270

    瀏覽量

    301874
  • 英偉達
    +關注

    關注

    23

    文章

    4108

    瀏覽量

    99382
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    高通挑戰英偉,發布768GB內存AI推理芯片,“出征”AI數據中心

    億美元的數據中心市場中搶占一席之地。 就在10月28日,高通面向數據中心連發兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI 推理
    的頭像 發表于 10-29 10:36 ?3726次閱讀
    高通挑戰<b class='flag-5'>英偉</b><b class='flag-5'>達</b>,發布768GB內存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數據中心

    高通挑戰英偉!發布768GB內存AI推理芯片,“出征”AI數據中心

    億美元的數據中心市場中搶占一席之地。 ? 就在10月28日,高通面向數據中心連發兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI
    的頭像 發表于 10-29 09:14 ?6559次閱讀
    高通挑戰<b class='flag-5'>英偉</b><b class='flag-5'>達</b>!發布768GB內存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數據中心

    堪稱史上最強推理芯片!英偉發布 Rubin CPX,實現50倍ROI

    電子發燒友網報道(文/梁浩斌)近日,英偉AI infra峰會上發布了專為大規模上下文推理設計的全新GPU系列Rubin CPX,性能堪稱炸裂! ?
    的頭像 發表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>發布 Rubin CPX,實現50倍ROI

    AI推理需求井噴!英偉Q1營收大漲,H20禁售難擋增長步伐

    電子發燒友原創 章鷹 在中美科技企業爭奪人工智能高地的競爭中,處于第一方陣的美國AI芯片公司英偉公司最新交出了讓市場滿意的答卷。 5月28日,英偉
    的頭像 發表于 05-31 01:13 ?8276次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>需求井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>Q1營收大漲,H20禁售難擋增長步伐

    GPU不是AI的唯一解:英偉用Groq LPU證明,推理賽道需要“另一條腿”

    ? 電子發燒友網報道(文/莫婷婷)過去十年,人工智能的爆發式增長與GPU需求緊密相連。憑借其卓越的并行計算能力,GPU成為AI算力的絕對代名詞。 ? 然而,英偉給出顛覆性的新解。在最新的GTC
    的頭像 發表于 03-24 11:27 ?1553次閱讀
    GPU不是<b class='flag-5'>AI</b>的唯一解:<b class='flag-5'>英偉</b><b class='flag-5'>達</b>用Groq LPU證明,<b class='flag-5'>推理</b>賽道需要“另一條腿”

    英偉電話會看Agentic AI推理與FPGA價值

    2026年2月,英偉發布2026財年Q4財報:營收681億美元,同比增長73%,數據中心業務增長75%——預期中的超預期。更值得關注的,是電話會中反復出現的幾個關鍵詞:Agentic AI
    的頭像 發表于 03-04 17:07 ?1128次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達</b>電話會看Agentic <b class='flag-5'>AI</b><b class='flag-5'>推理</b>與FPGA價值

    AI推理芯片需求爆發,OpenAI欲尋求新合作伙伴

    電子發燒友網綜合報道,在人工智能迅猛發展的當下,AI推理芯片需求正呈爆發式增長。 ? AI推理,即支撐如ChatGPT這類AI模型響應用戶問
    的頭像 發表于 02-03 17:15 ?3032次閱讀

    第四次工業革命AI將實現十億倍增長 | 中國AI芯片與英偉的角色

    內容提要:黃仁勛BG2專訪:英偉、OpenAI、算力未來與美國夢AI規模定律與推理的革命:在傳統的AI規模定律(預訓練、后訓練)之上,引入
    的頭像 發表于 09-29 07:20 ?1220次閱讀
    第四次工業革命<b class='flag-5'>AI</b>將實現十億倍增長 | 中國<b class='flag-5'>AI</b>芯片與<b class='flag-5'>英偉</b><b class='flag-5'>達</b>的角色

    中科創重磅發布ThunderSoft AI Box

    近日,在行業矚目的軒轅汽車藍皮書論壇上,中科創重磅發布ThunderSoft AI Box!這款革命性的AI算力平臺以 “即插即用、靈活配置、全棧軟件” 三大創新特性,開辟 “
    的頭像 發表于 06-20 11:40 ?1967次閱讀

    英偉AI人才,去了華為

    電子發燒友網綜合報道 近日,英偉首席科學家比爾·戴利(Bill Dally)表示,美國對中國實施的人工智能出口管制禁令,讓中國獲得很大的發展空間,過去替英偉撰寫程序的中國人工智能研
    的頭像 發表于 06-06 00:05 ?7394次閱讀

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓練、AI
    的頭像 發表于 03-31 11:27 ?1408次閱讀

    英偉Cosmos-Reason1 模型深度解讀

    英偉近期發布的 Cosmos-Reason1 模型在物理常識推理領域引發廣泛關注。作為專為物理世界交互設計的多模態大語言模型,它通過融合視覺感知與復雜邏輯推理,重新定義了
    的頭像 發表于 03-29 23:29 ?3110次閱讀

    英偉、高通布局AI投資版圖,這些明星企業被收入囊中!

    電子發燒友原創 章鷹 今年以來,AI界新秀DeepSeek帶來的大模型平權推動AI應用,云計算市場景氣度上行,推動資本開支增長。對于DeepSeek的橫空出世,英偉CEO黃仁勛表示,
    的頭像 發表于 03-25 09:22 ?2186次閱讀

    IBM攜手英偉AI數據平臺推動企業級AI創新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數據平臺參考架構(re
    發表于 03-24 19:20 ?538次閱讀