国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沐曦曦云C系列產品已支持TileLang

沐曦MetaX ? 來源:沐曦MetaX ? 2025-10-14 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一門由TileLang社區主導開發的編程語言,正悄然改變國產GPU的生態格局。

近日,DeepSeek宣布在其新版本中擁抱國產GPU語言TileLang,引發業界廣泛關注。作為國產高性能GPU的代表,沐曦曦云C系列產品已率先在這一新興開源社區獲得支持。TileLang項目是由TileLang社區主導開發,旨在簡化高性能GPU/CPU內核的開發。它采用Python式語法,讓開發者能夠專注于提高生產力,而無需犧牲實現最佳性能所需的底層優化。

1生態破局:國產算力的協同前行

TileLang作為一種專門用來開發GPU內核的領域專用語言,性能上可以對標國際主流生態。DeepSeek官方推薦開發者使用該版本進行實驗性開發,因其在調試便捷性與迭代速度上具備明顯優勢。這一特性對正在積極構建軟件生態的國產GPU廠商來說,無疑是重要機遇。

沐曦率先跟進這一機遇。沐曦AI編譯器團隊和TileLang社區合作已提前參與該項目,探討沐曦GPU與TileLang的適配。 這種與開源社區的緊密合作,顯著加快了沐曦曦云C系列產品融入主流開發生態的速度。

2生態適配:從追趕者到參與者

在算力領域,硬件性能只是基礎,軟件生態才是決定成敗的關鍵。沐曦MXMACA軟件棧作為連接硬件與應用的橋梁,其兼容性與性能直接關系到用戶體驗。目前沐曦MXMACA軟件棧已實現對主流國際主流生態的兼容,原生支持PyTorch、TensorFlow及國產框架。這種兼容性設計讓開發者能夠幾乎無成本地將現有項目遷移到MXMACA軟件棧。

如今,MXMACA對TileLang社區的快速支持更進一步,體現了沐曦在開源生態建設上的敏銳度。TileLang作為重要的AI計算編譯器項目,其對MXMACA的支持不僅減少了開發者適配工作量,更打通了沐曦硬件與現代化AI編譯工具鏈的通道。

在WAIC 2025期間,沐曦聯合創始人、CTO兼首席軟件架構師楊建曾明確表示,“GPU芯片的價值發揮離不開軟件驅動,從底層驅動、中間框架到上層應用,形成完整鏈條”。 這一理念正在通過實際的開源貢獻得以踐行。

3開發效率:TileLang的革命性突破

TileLang最顯著的優勢在于大幅提升GPU內核的開發效率。TileLang實現FlashAttention算子開發,代碼量從500+行減少至80行,并保持了與官方版本持平的性能。這種代碼量的大幅減少不僅降低了開發門檻,也提高了維護性和可讀性。

有開發者感嘆TileLang是一種非常優雅的語言,只需不到100行代碼就能寫出比Flash Attention 2原版快30%。這種開發效率與性能兼得的特點,正是TileLang引發關注的重要原因。

TileLang提供了三個不同層次的編程接口,滿足從初學者到專家不同水平開發者的需求。 這種分層設計使曦云C系列的開發者能夠根據自身熟練程度,選擇合適的切入點進行算子開發與優化。

4實戰驗證:從原型到產品的性能表現

DeepSeek選擇TileLang并非偶然,而是基于實際性能驗證。具體的性能數據來自TileLang以DeepSeek發布的FlashMLA內核作為評測基準的實驗:在英偉達H100上的MLA解碼速度,TileLang編寫的內核做到與FlashMLA相當。這一結果證明了TileLang在性能上具備與國際先進產品競爭的實力。DeepSeek v3.2也驗證了TileLang確實可以用來訓練模型。 這一實踐意義重大,表明了TileLang已從實驗階段走向實際生產應用。

沐曦開源的TileLang已發布在gitee倉庫【mcTileLang】,基于TileLang已有的優化效果詳細性能如下:

70ef6956-9e0e-11f0-8c8f-92fbcf53809c.png

表1 測試數據及性能

可以預期在常用核心算子上將有與國際領先產品競爭甚至超越的表現,期待開源社區一起共建和持續更新。

4在線體驗:模力方舟曦云C系列體驗

為了讓開發者更便捷地體驗TileLang在曦云C系列上的性能表現,沐曦已在模力方舟平臺提供在線體驗環境。這一平臺將提供預配置的開發環境,讓開發者無需自行搭建硬件平臺,即可體驗TileLang在曦云C系列上的算子開發和優化過程。

從芯片到編譯器,從硬件到生態,沐曦曦云C系列產品與TileLang的快速適配展現了中國算力產業的新思路:不再單點突破,而是攜手開源生態共進。

沐曦曦云C系列產品在TileLang社區的支持只是國產GPU漫長征程中的一小步,卻是生態建設上質變的一大步。當開發者們在模力方舟平臺上輕點鼠標,就能在曦云系列上運行優化后的TileLang代碼,那種生態隔閡的堅冰正悄然消融。

未來的算力格局,注定是多元共存、開源生態共榮的圖景。

關于沐曦

沐曦致力于自主研發全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數字經濟發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5118

    瀏覽量

    134556
  • 開源
    +關注

    關注

    3

    文章

    4056

    瀏覽量

    45651
  • 沐曦
    +關注

    關注

    1

    文章

    59

    瀏覽量

    1667
  • DeepSeek
    +關注

    關注

    2

    文章

    826

    瀏覽量

    2859

原文標題:沐曦已支持TileLang,性能比肩國際主流

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    股份C系列GPU Day 0適配智譜GLM-4.6V多模態大模型

    12月8日智譜AI發布并開源 GLM-4.6V 系列多模態大模型,股份C
    的頭像 發表于 12-17 14:28 ?218次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b><b class='flag-5'>系列</b>GPU Day 0適配智譜GLM-4.6V多模態大模型

    DLInfer聯手股份實現數據生成場景的實際落地

    近期,上海 AI 實驗室 DeepLink 團隊推出的 DLInfer 通過支持 LMDeploy 主流模型推理,助力股份
    的頭像 發表于 12-09 14:55 ?443次閱讀
    DLInfer聯手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份實現數據生成場景的實際落地

    股份與上海電信完成首期GPU生態專家認證培訓

    近期,集成電路(上海)股份有限公司(以下簡稱“股份”)攜手上海電信天翼能力運營中心(以下簡稱“
    的頭像 發表于 10-31 10:33 ?295次閱讀

    強強聯合:之江實驗室與股份共建智算集群聯合實驗室

    2025年10月22日, 之江實驗室與集成電路(上海)股份有限公司(以下簡稱“股份”)正式簽署合作協議,共同組建“智算集群聯合實驗室”,攜手推進人工智能算力基礎設施創新發展 。
    的頭像 發表于 10-23 10:50 ?1111次閱讀

    首款全國產通用GPU芯片發布 集成推出C600

    集成電路(南京)有限公司近日正式發布了首款全國產通用GPU——C600,這標志著國產高性能GPU實現歷史性突破。 據新華日報報道顯示
    的頭像 發表于 10-19 20:04 ?4.5w次閱讀

    GPU與龍蜥操作系統完成適配

    集成電路(上海)股份有限公司(以下簡稱"")于 2020 年 9 月成立于上海,其擁有技術完備、設計和產業化經驗豐富的團隊,曾主導過十多款世界主流高性能 GPU
    的頭像 發表于 10-17 15:06 ?880次閱讀

    書生大模型實戰營魔樂專場MeetUP精彩回顧

    近日,由書生大模型社區、、魔樂社區、算豐和 DaoCloud 道客等聯合打造的「書生大模型實戰營魔樂專場 MeetUP 暨頒獎儀式」在上海漕河涇國際孵化中心圓滿落幕。
    的頭像 發表于 08-20 11:33 ?943次閱讀

    亮相2025世界人工智能大會

    子技術標準化研究院、上海市算力網絡協會等權威機構,匯聚院士、政府領導、頭部企業CTO及學術領袖共話AI算力未來。論壇現場重磅發布基于國產供應鏈的旗艦GPUC600,首發訓推一體技術全棧方案,聚焦“開源生態”與“訓推能力”兩大
    的頭像 發表于 07-28 18:08 ?4523次閱讀

    硅基流動攜手首發基于的Kimi K2推理服務

    今天,硅基流動聯合集成電路(上海)股份有限公司(簡稱“”),全球首發基于
    的頭像 發表于 07-23 17:33 ?1602次閱讀

    PaddleScience完成與AI芯片適配

    當前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計算、科學建模等多個方向。這一趨勢正加速形成面向"Al for Science"的國產智算生態新格局。
    的頭像 發表于 05-06 14:49 ?1428次閱讀

    C500通用計算GPU與百度飛槳完成Ⅱ級兼容性測試

    近日,C500通用計算GPU與百度飛槳已完成Ⅱ級兼容性測試。測試結果顯示,雙方兼容性表現良好,整體運行穩定。這是
    的頭像 發表于 03-31 14:22 ?1538次閱讀

    加速DeepSeek滿血版單卡C500異構推理

    近日,基于開源KTransformers架構的 CPU/GPU 異構推理能力,C500單卡GPU上成功實現DeepSeek-R1-
    的頭像 發表于 03-20 15:52 ?1956次閱讀

    Gitee AI 聯合首發全套 DeepSeek R1 千問蒸餾模型,全免費體驗!

    、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個較小尺寸的 DeepSeek 模型。值得關注的是, 本次上線的四個模型均部署在國產
    的頭像 發表于 02-10 09:56 ?1124次閱讀
    Gitee AI 聯合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首發全套 DeepSeek R1 千問蒸餾模型,全免費體驗!

    澎峰科技與完成聯合測試,實現全面兼容

    近日,澎峰科技與科技宣布,雙方已完成對PerfXLM推理引擎、PerfXCloud大模型服務平臺與
    的頭像 發表于 01-21 15:20 ?1004次閱讀

    澎峰科技計算軟件棧與GPU完成適配和互認證

    ?近期,澎峰科技與完成了對PerfXLM(推理引擎)、PerfXCloud(大模型服務平臺)與
    的頭像 發表于 01-21 09:51 ?1245次閱讀