近日,蘇州登臨科技股份有限公司(以下簡稱“登臨科技”)自主研發的KS系列高性能通用GPU已全面完成對最新一代大模型MiniMax M2.5的深度適配與優化。通過創新的GPU+架構,登臨科技不僅實現了對MiniMax M2.5模型的高效支持,更依托KS38/ KS58云端推理卡——單卡最高配備128GB顯存,推出僅需2卡即可部署MiniMax M2.5的突破性方案,大幅降低整體部署成本。將大模型部署的硬件門檻與成本降至行業新低,為企業級AI應用的規模化落地注入強勁動力。
MiniMax M2.5 深度適配
提供超低成本部署方案
MiniMax M2.5作為MiniMax M2.x系列發布的最新版本模型,在代碼編寫、智能體工具使用與搜索、辦公任務以及一系列其他具有經濟價值的任務上達到當前最先進(SOTA)水平,在 SWE-Bench Verified、Multi-SWE-Bench 和 BrowseComp(含上下文管理)等評測中分別取得了 80.2%、51.3% 和 76.3% 的高分。隨著OpenClaw的爆火,全球API調用token數量暴增,據全球最大LLM API聚合平臺OpenRouter 2月24日數據,中國AI模型Token消耗量占平臺前十總量的61%,前三名全部來自中國實驗室。MiniMax M2.5以單周2.45萬億Token登頂榜首,環比暴漲197%。
目前登臨的KS38/ KS58云端推理卡,單卡最高配備128GB顯存,2卡即可部署MiniMax M2.5,極大降低綜合部署成本。并提供單服務器內模型全上下文長度推理,釋放MiniMax M2.5完整能力。

GPU+架構:效率與通用的完美融合
重新定義算力效能
登臨科技的GPU+架構是其核心技術優勢所在,它巧妙地融合了傳統 GPU 的通用性與 ASIC 的高效率,為大模型推理等 AI 應用提供了從算力到能效的全面解決方案。
卓越能效比,降本增效的關鍵登臨 GPU+架構通過創新的可擴展、軟件定義的片內異構體系結構,實現了能效比的大幅提升,在算力需求暴漲的今天,能源消耗成為算力擴展瓶頸的趨勢愈發明顯,GPU+架構正是解決這一困境的鑰匙。
高度生態兼容性,降低遷移門檻登臨硬件兼容 CUDA/OpenCL 等現有軟件生態,算法模型可平滑遷移,極大節約了企業的移植成本和開發周期。在大模型領域,登臨軟件棧更是在Day0適配了DeepSeek、GLM、MiniMax、Kimi、GPT-OSS等國內外主流大模型。
強大算力與內存支持,超長上下文處理登臨納適II 系列加速卡提供了高達560 TOPS 的云端有效AI算力,以及 128GB 的大顯存配置,為大模型推理和超長上下文提供基礎支撐。
全棧國產化與自主可控,保障供應鏈安全登臨堅持自主創新,核心IP(架構/微架構/算術單元等)全自研,已申請國內外各類知識產權 200 余項。其產品支持 Windows10、Linux、麒麟等系統,并兼容各類國產 CPU,確保了從硬件到軟件的全國產化能力,為客戶提供了安全可靠的算力底座。
行業價值與未來展望
登臨科技 KS 系列對 MiniMax M2.5 的支持,以及 KS38/KS58 兩卡部署方案的推出,不僅為企業提供了高性能、低成本的大模型運行平臺,更在多個層面創造了顯著的行業價值:
降低 AI 應用門檻 :使更多中小企業能夠負擔得起先進的大模型技術,加速 AI 技術的普及和應用。
提升業務處理效率 :在內容審核、智能客服、數據分析等場景中,提供更快、更準確的處理能力,提升業務效率和用戶體驗。
推動國產算力發展 :作為國產高性能通用 GPU 的領先企業,登臨科技通過實際應用驗證了國產算力的可靠性和先進性,為構建自主可控的 AI 算力生態貢獻力量。
展望未來,登臨科技將持續深化在大模型領域的技術創新與行業應用,致力于推動 AI 視覺與大模型的深度融合,優化 AI 模型部署與優化門檻,拓展全場景 AI 應用,為各行業的智能化升級提供更高效、更智能、更安全的算力解決方案。
關于登臨
蘇州登臨科技股份有限公司是一家專注于高性能通用 GPU 設計與研發的創新型企業,致力于為 AI 計算、圖形渲染、高性能計算等領域提供自主可控、高效能的算力解決方案。公司以“技術賦能行業革新”為理念,通過自主研發的GPU+架構,在多個行業實現了規模化商業落地,成為推動國產算力發展的關鍵力量。
-
gpu
+關注
關注
28文章
5194瀏覽量
135429 -
登臨科技
+關注
關注
0文章
19瀏覽量
826
原文標題:登臨科技KS系列全面適配MiniMax M2.5,GPU+架構驅動大模型部署成本革命
文章出處:【微信號:gh_313558c425fe,微信公眾號:登臨科技 DenglinAI】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
摩爾線程業績快報:2025年營收同比增長243.37%,S5000全棧適配SOTA大模型加速釋放商業潛能
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產品深度適配MiniMax M2.5模型
登臨科技基于納適系列國產化GPU推出文檔PDF解析行業解決方案
大模型 ai coding 比較
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
曦云C系列GPU Day 0 適配智譜全新一代大模型GLM-5
壁仞科技壁礪166M產品適配模思智能MOSS-TTS Family模型
塔力科技與登臨科技達成戰略合作
壁仞科技完成Qwen3旗艦模型適配
愛芯通元NPU適配Qwen2.5-VL-3B視覺多模態大模型
登臨科技KS系列GPU產品全面適配MiniMax M2.5模型
評論