国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沐曦GPU跑通DeepSeek開源代碼庫FlashMLA

沐曦MetaX ? 來源:沐曦MetaX ? 2025-02-25 16:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepSeek 開源周

今日,DeepSeek正式啟動"開源周"計劃,首發代碼庫FlashMLA一經開源即引發全網關注。截至發稿,該項目已在GitHub斬獲超7.2K Star!

沐曦技術團隊在FlashMLA開源后迅速響應,僅用2小時即完成與沐曦GPU的適配工作,并于當日將代碼提交至開源社區。本次適配成功后,MXMACA平臺也可完美運行FlashMLA,這充分驗證了沐曦GPGPU架構與MXMACA軟件平臺在生態兼容性方面的先天優勢!

FlashMLA通過MLA解碼優化與分頁KV緩存技術等顯著提升硬件利用率,可加速大語言模型解碼過程,有效提升響應速度與吞吐量,尤其適用于聊天機器人等實時生成場景。沐曦在適配中應用矩陣吸收算法將低秩投影融入Flash Attention 2核函數,在保證計算效率的同時顯著降低顯存占用。同步構建了MXMACA自動化測試體系覆蓋常規及邊界場景,確保功能準確性與數值穩定性,為長文本生成等顯存敏感場景提供顯著性能增益。沐曦本次提交的代碼不僅突破了官方實現中對Hopper架構的依賴,還新增支持64以外的多樣化page size配置,大幅提升框架適用性,為開源社區帶來實質性技術貢獻。

明天,DeepSeek開源計劃第二彈即將揭曉,敬請期待后續動態!

關于沐曦

沐曦致力于為異構計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產品,推出曦思N系列GPU用于智算推理,曦云C系列GPU用于通用計算,以及曦彩G系列GPU用于圖形渲染,滿足“高能效”及“高通用性”的算力需求。沐曦產品均采用完全自主研發的GPU IP,擁有完全自主的指令集和架構,配以兼容主流GPU生態的完整軟件棧(MXMACA),具備高能效和高通用性的天然優勢,能夠為客戶構建軟硬件一體的全面生態解決方案,是“雙碳”背景下推動數字經濟建設和產業數字化、智能化轉型升級的算力基石。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135433
  • 開源
    +關注

    關注

    3

    文章

    4204

    瀏覽量

    46130
  • 沐曦
    +關注

    關注

    1

    文章

    80

    瀏覽量

    1811
  • DeepSeek
    +關注

    關注

    2

    文章

    835

    瀏覽量

    3260

原文標題:2小時極速適配!沐曦GPU率先跑通DeepSeek開源代碼庫FlashMLA!

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    股份云C系列GPU全面適配通義千問Qwen3.5三款新模型

    今日,通義千問團隊正式開源發布Qwen3.5系列中等規模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三個版本。股份旗下
    的頭像 發表于 02-28 10:05 ?399次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b>全面適配通義千問Qwen3.5三款新模型

    股份云C系列GPU深度適配通義千問Qwen3.5模型

    今天,通義千問今天正式發布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權重版本。股份云C系列GPU 完成對Qwen 3.5模
    的頭像 發表于 02-26 14:26 ?416次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b>深度適配通義千問Qwen3.5模型

    云C500/C550 GPU產品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開源MiniMax M2.5模型。技術團隊依托MXMACA軟件棧,在24小時內完成云C500/C550 對該模型的深度適配。
    的頭像 發表于 02-26 14:19 ?612次閱讀

    云C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    ,支持模型“零代碼”或極低改造成本遷移。MXMACA已于2025年2月正式開源,目前用戶規模已突破25萬人。 云C系列GPU基于
    的頭像 發表于 02-12 10:53 ?801次閱讀
    <b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b> Day 0 適配智譜全新一代大模型GLM-5

    云C500/C550 GPU產品適配智譜GLM-OCR模型

    今天,智譜AI正式發布并開源GLM-OCR,以 “小尺寸、高精度” 實現文檔解析能力新標桿。股份云C500/C550 GPU充分發揮高
    的頭像 發表于 02-03 11:36 ?656次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 <b class='flag-5'>GPU</b>產品適配智譜GLM-OCR模型

    股份正式推出索X系列全新GPU品牌與產品線

    1月27日,股份(股票代碼:688802.SH)正式推出索X系列全新GPU品牌與產品線。該系列產品是面向科學智能場景深度優化的高性能計
    的頭像 發表于 01-28 17:14 ?622次閱讀

    受邀出席第二屆開源產業生態大會

    以“開源筑基·數實維新”為主題的第二屆開源產業生態大會將于1月13日在上海舉行。受邀出席本次行業盛會,聯合創始人、CTO兼首席軟件架構師楊建將發表主題演講并參與圓桌論壇環節,分享
    的頭像 發表于 01-14 13:51 ?296次閱讀

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態大模型

    12月8日智譜AI發布并開源 GLM-4.6V 系列多模態大模型,股份云C系列GPU完成Day 0適配。
    的頭像 發表于 12-17 14:28 ?620次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b> Day 0適配智譜GLM-4.6V多模態大模型

    股份與上海電信完成首期GPU生態專家認證培訓

    近期,集成電路(上海)股份有限公司(以下簡稱“股份”)攜手上海電信天翼云能力運營中心(以下簡稱“云能力運營中心”)順利完成了首期GPU
    的頭像 發表于 10-31 10:33 ?491次閱讀

    首款全國產通用GPU芯片發布 集成推出云C600

    集成電路(南京)有限公司近日正式發布了首款全國產通用GPU——云C600,這標志著國產高性能GPU實現歷史性突破。 據新華日報報道顯示
    的頭像 發表于 10-19 20:04 ?4.6w次閱讀

    GPU與龍蜥操作系統完成適配

    集成電路(上海)股份有限公司(以下簡稱"")于 2020 年 9 月成立于上海,其擁有技術完備、設計和產業化經驗豐富的團隊,曾主導過十多款世界主流高性能
    的頭像 發表于 10-17 15:06 ?1189次閱讀

    云C系列產品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國產GPU語言TileLang,引發業界廣泛關注。作為國產高性能GPU的代表,
    的頭像 發表于 10-14 09:25 ?1181次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C系列產品已支持TileLang

    硅基流動攜手首發基于云的Kimi K2推理服務

    天網絡”)運營的云C550 三千卡通用 GPU 國產集群。此次合作標志著硅基流動正式將該國產集群納入算力網絡,進一步為大模型產業落地提供充沛的高性能國產算力。
    的頭像 發表于 07-23 17:33 ?1927次閱讀

    云C500通用計算GPU與百度飛槳完成Ⅱ級兼容性測試

    近日,云C500通用計算GPU與百度飛槳已完成Ⅱ級兼容性測試。測試結果顯示,雙方兼容性表現良好,整體運行穩定。這是
    的頭像 發表于 03-31 14:22 ?1819次閱讀

    加速DeepSeek滿血版單卡C500異構推理

    近日,基于開源KTransformers架構的 CPU/GPU 異構推理能力,云C500單卡GP
    的頭像 發表于 03-20 15:52 ?2235次閱讀