伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

萬億參數!元腦企智一體機率先支持Kimi K2大模型

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2025-07-22 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2025年7月21日 /美通社/ --浪潮信息宣布元腦企智一體機已率先完成對Kimi K2 萬億參數大模型的適配支持,并實現單用戶70 tokens/s的流暢輸出速度,為企業(yè)客戶高效部署應用大模型提供高處理性能和完善的軟件工具平臺支持。


Kimi K2是月之暗面推出的開源萬億參數大模型,創(chuàng)新使用了MuonClip優(yōu)化器進行訓練,大幅提升了模型的學習效率。K2在代碼生成、數學推理、Agent多步驟任務上展現出領先能力,評測指標達到業(yè)界領先水平。自發(fā)布以來,K2在開發(fā)者和研究社區(qū)引起廣泛關注,迅速獲得在編碼輔助和Agent驅動自動化任務中的部署應用。

Kimi K2的模型總參數量達1萬億,激活參數為320億。K2使用混合專家(MoE)模型結構,較DeepSeek V3采用了更大的參數量和更多的專家數。K2模型1萬億的參數量對AI計算系統提出至少1TB的顯存容量需求,384個路由專家所帶來的專家負載不均衡性對推理速度有很大影響。目前業(yè)界可公開訪問的K2 API的輸出速度一般低于20 tokens/s,這樣較低的性能對于編程或Agent類場景很不友好,會嚴重影響用戶體驗。Kimi K2憑借其為智能體任務設計的架構和優(yōu)秀的智能體驗,展現出巨大的應用潛力,但提升推理速度和輸出穩(wěn)定性是其成為可信賴的生產力工具需要解決的核心挑戰(zhàn)。

元腦企智一體機采用元腦服務器NF5688G7作為算力底座,其搭載FP8計算引擎,配備1128GB HBM3e高速顯存,單臺服務器即可支持K2 萬億參數全量模型部署。NF5688G7服務器具備900GB/s的GPU P2P帶寬,為Kimi K2提供了專家間高速并行通信,最大化并行效率。該服務器可支持3200Gbps的RDMA擴展網絡,為預填充-解碼分離部署和大規(guī)模專家并行預留了充足的擴展空間。

浪潮信息已完成元腦企智一體機對K2的適配,支持64K上下文長度和多路用戶實時并發(fā)訪問。基于SGLang推理框架,通過減少MoE對齊塊大小內核的小批量模式開銷和fused_moe的內存消耗,并復用deepGEMM等高效算子,實現單用戶并發(fā)下輸出速度超過70 tokens/s,25用戶并發(fā)時每用戶輸出速度超過25 tokens/s。優(yōu)化后的計算性能可保證用戶在進行復雜的代碼生成、長文本書寫或Agent調用時,能夠獲得流暢、低延遲的交互體驗。

wKgZO2h-PNGAL-wnAAF67yjafGk421.jpg


SGLang啟動K2推理服務,用戶交互時的解碼速度

元腦企智一體機提供了元腦企智(EPAI)平臺與K2大模型的無縫集成,為企業(yè)用戶提供了一套軟硬件協同優(yōu)化、開箱即用的端到端大模型私有化部署解決方案。通過元腦企智平臺,企業(yè)可利用低代碼、可視化界面,便捷地進行數據準備、模型微調、知識檢索(RAG)和智能體(Agent)構建。

元腦企智一體機已成功部署于金融、制造、能源、醫(yī)療等多個關鍵行業(yè),幫助企業(yè)快速、安全、經濟地構建專屬大模型應用,加速產業(yè)智能化轉型步伐。

浪潮信息是全球領先的IT基礎設施產品、方案和服務提供商,通過發(fā)展新一代以系統為核心的計算架構,打造開放、多元、綠色的元腦智算產品和方案。浪潮信息致力于AI計算平臺、資源平臺和算法平臺的研發(fā)創(chuàng)新,并通過元腦生態(tài)攜手領先伙伴,加速人工智能的創(chuàng)新和應用落地。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 大模型
    +關注

    關注

    2

    文章

    3715

    瀏覽量

    5239
  • Kimi
    +關注

    關注

    0

    文章

    14

    瀏覽量

    328
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    瀚博半導體GPU云底座與一體機方案支持OpenClaw開源AI智能框架

    瀚博半導體,以創(chuàng)新的GPU云底座與一體機方案,支持OpenClaw開源AI智能框架,全天候運行AI智能,在大幅提升數字生產力的同時保證數據安全與隱私安全,讓智能
    的頭像 發(fā)表于 03-11 13:39 ?430次閱讀
    瀚博半導體GPU云底座與<b class='flag-5'>一體機</b>方案<b class='flag-5'>支持</b>OpenClaw開源AI智能<b class='flag-5'>體</b>框架

    OBOO鷗柏交互式查詢一體機:展館里的智能信息導航站

    一體機
    鷗柏科技
    發(fā)布于 :2025年12月30日 19:04:58

    飛騰錄播一體機,高度集成、穩(wěn)定上架,定義視頻采集新基準#

    一體機
    gnhpc
    發(fā)布于 :2025年12月30日 17:22:20

    潤和軟件入選大模型一體機產業(yè)圖譜

    近日,由中國人工智能產業(yè)發(fā)展聯盟與中國信息通信研究院聯合編制的《大模型一體機產業(yè)圖譜》正式發(fā)布。該圖譜系統梳理并收錄了國內大模型一體機產業(yè)鏈上下游70余家代表性企業(yè),全面呈現我國大
    的頭像 發(fā)表于 12-10 17:56 ?1610次閱讀
    潤和軟件入選大<b class='flag-5'>模型</b><b class='flag-5'>一體機</b>產業(yè)圖譜

    澎峰科技最新推出Deep Fusion DF35智算一體機

    在人工智能加速落地的今天,企業(yè)部署大模型面臨成本、性能與數據安全的三重挑戰(zhàn)。澎峰科技最新推出的Deep Fusion DF35智算一體機,以29000起的突破性定價,將Qwen3-Next 80B FP16精度
    的頭像 發(fā)表于 10-13 16:51 ?1874次閱讀
    澎峰科技最新推出Deep Fusion DF35智算<b class='flag-5'>一體機</b>

    屏掌控全場:OBOO鷗柏65寸國產飛騰D2000觸摸查詢一體機,高效無憂

    一體機
    鷗柏科技
    發(fā)布于 :2025年09月29日 18:55:01

    遠景達掃碼模組適用于觸摸一體機終端的型號

    隨著數字化交互場景的拓展,遠景達掃碼模組憑借其高效識別速度、多設備適配能力及穩(wěn)定運行表現,成為觸摸一體機終端的關鍵配置組件。本文結合技術參數與實際應用案例,整理其適用于觸摸一體機的主流型號及技術特點
    的頭像 發(fā)表于 08-11 16:12 ?902次閱讀
    遠景達掃碼模組適用于觸摸<b class='flag-5'>一體機</b>終端的型號

    浪潮信息發(fā)布&quot;SD200&quot;超節(jié)點,面向萬億參數模型創(chuàng)新設計

    擴展支持64路本土GPU芯片。SD200可實現單機內運行超萬億參數模型,并
    的頭像 發(fā)表于 08-08 22:17 ?741次閱讀
    浪潮信息發(fā)布&quot;<b class='flag-5'>元</b><b class='flag-5'>腦</b>SD200&quot;超節(jié)點,面向<b class='flag-5'>萬億</b><b class='flag-5'>參數</b>大<b class='flag-5'>模型</b>創(chuàng)新設計

    ?Groq LPU 如何讓萬億參數模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何讓萬億參數模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技? 最近,Moonshot AI 的千億參數
    的頭像 發(fā)表于 08-07 10:01 ?1232次閱讀

    硅基流動攜手沐曦首發(fā)基于曦云的Kimi K2推理服務

    今天,硅基流動聯合沐曦集成電路(上海)股份有限公司(簡稱“沐曦”),全球首發(fā)基于沐曦曦云 C550 集群的月之暗面 Kimi-K2模型商業(yè)化服務部署。該服務運行于匯天網絡科技有限公司(簡稱“匯
    的頭像 發(fā)表于 07-23 17:33 ?2052次閱讀

    一體機主板步入大存儲時代,存儲突圍到性能質變

    ,我們發(fā)現了客戶新的需求。一體機電腦場景在企業(yè)辦公多任務處理中,多開辦公軟件、數據報表處理卡頓,需要更多內存支持多應用同時流暢運行。場景二專業(yè)設計與渲染、4K視頻剪
    的頭像 發(fā)表于 06-19 10:47 ?629次閱讀
    <b class='flag-5'>一體機</b>主板步入大存儲時代,存儲突圍到性能質變

    開普云「開悟智核」:極致性價比的智能一體機,破局大模型應用難題

    當下,AI一體機憑借開箱即用、數據可控等優(yōu)勢,成為行業(yè)大模型落地的重要載體之。然而實際應用時,用戶卻面臨諸多問題:算力成本與性能難以平衡;非滿血版模型存在“幻覺”、精度低等問題;由于
    的頭像 發(fā)表于 06-09 10:34 ?1263次閱讀
    開普云「開悟智核」:極致性價比的智能<b class='flag-5'>體</b><b class='flag-5'>一體機</b>,破局大<b class='flag-5'>模型</b>應用難題

    松下4K手持式攝錄一體機AJ-UPX380介紹

    2025年第季度,松下正式推出4K手持式攝錄一體機AJ-UPX380,旨在為廣播及流媒體專業(yè)人士提供更高品質的視頻制作解決方案。作為UPX系列專業(yè)攝錄一體機的新成員,AJ-UPX38
    的頭像 發(fā)表于 05-30 15:54 ?1775次閱讀

    21.5寸觸摸一體機:便捷互動的新窗口

    一體機
    朗銳智科
    發(fā)布于 :2025年04月10日 15:34:00