国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepSeek V3.1發布!擁抱國產算力芯片

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2025-08-23 07:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/李彎彎)2025年8月21日,DeepSeek正式官宣發布DeepSeek-V3.1大模型。新版本不僅在技術架構上實現重大升級,更通過參數精度優化與國產芯片深度適配。從混合推理架構到Agent能力突破,從API價格調整到國產芯片生態共建,DeepSeek V3.1的發布標志著中國AI產業進入技術突破與產業落地協同發展的新階段。

圖:DeepSeek正式發布DeepSeek-V3.1(來自DeepSeek官微)


DeepSeek V3.1的技術突破與生態升級

DeepSeek V3.1的核心創新在于混合推理架構的規模化應用。該架構首次實現單一模型同時支持思考模式與非思考模式:在思考模式下,模型通過深度推理提升復雜任務處理能力;在非思考模式下,則通過精簡計算路徑實現高效響應。測試數據顯示,V3.1-Think在輸出token數減少20%-50%的情況下,各項任務平均表現與前代R1-0528持平,而非思考模式的輸出長度控制能力則幫助用戶降低使用成本。

圖:在各項評測指標得分基本持平的情況下(來自DeepSeek官微)


參數精度優化是另一重大突破。V3.1采用UE8M0 FP8 Scale技術,將參數精度提升至8位浮點數規模。這一設計不僅減少30%的內存占用,更通過量化感知訓練保持模型精度。DeepSeek官方透露,UE8M0 FP8標準是專為下一代國產芯片設計的計算范式,可顯著提升芯片在AI推理場景下的能效比。

FP8是Float8的簡稱,即用8位二進制數表示浮點數,主要用于深度學習的訓練和推理。相比傳統的FP32(32位浮點數)或FP16(16位浮點數),FP8顯著降低了顯存占用和計算資源需求,同時通過優化設計(如動態范圍調整)維持了較高的精度。??FP8對國產芯片的使用效率提升顯著,將進一步縮小與NVIDIA芯片的效率/成本差距,大大增加國產芯片的可用性。

在Agent能力方面,V3.1通過Post-Training優化實現質的飛躍。在代碼修復測評 SWE 與命令行終端環境下的復雜任務(Terminal-Bench)測試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。DeepSeek-V3.1 在多項搜索評測指標上取得了較大提升。在需要多步推理的復雜搜索測試(browsecomp)與多學科專家級難題測試(HLE)上,DeepSeek-V3.1 性能已大幅領先 R1-0528。官方將其定義為“邁向Agent時代的第一步”。

生態建設同步加速。官方App與網頁端同步升級V3.1,用戶可通過“深度思考”按鈕自由切換模式。API接口價格自9月6日起調整為輸入每百萬tokens 0.5元(緩存命中)/4元(未命中),輸出每百萬tokens 12元,同時取消夜間優惠。盡管價格有所上調,但輸入緩存命中成本保持不變,輸出成本增幅控制在50%以內,體現技術優化帶來的成本分攤效應。

國產芯片適配進程:從技術追趕到生態共建

DeepSeek與國產芯片的協同發展。2025年1月,華為昇騰910B率先完成V3模型適配,通過自研推理加速引擎使模型性能達到高端GPU水平,在智能安防、工業物聯網等端側場景實現本地化決策。2月,海光DCU完成V3與R1模型適配,其GPGPU架構支持全精度通用AI加速,通信延遲降低40%,訓練效率提升35%。同月,龍芯中科發文稱,搭載龍芯3號 CPU 的設備成功運行DeepSeek R1 7B模型,實現本地化部署。

多芯片廠商形成差異化競爭格局。沐曦曦云C500 GPU在V3推理中性能達國際主流產品的110%-130%,單位token成本僅為H100的70%;天數智芯支持R1千問蒸餾模型,提供穩定推理服務;壁仞科技壁礪系列覆蓋1.5B至70B參數規模的全系列蒸餾模型。摩爾線程成為首個支持原生FP8的國產GPU廠商,其MUSA架構為V3.1提供原生計算支持;芯原股份NPU芯原VIP9000實現FP8技術從云端訓練到硬件部署的快速遷移。

政策與市場形成雙輪驅動。國家超算互聯網平臺將DeepSeek模型納入標準算力庫,三大運營商在5G基站部署中優先采用適配國產芯片的AI推理模塊。

在能源行業私有化部署實踐中,中國石油、中國海油、國家管網等央企已完成DeepSeek私有化部署,中國海油采用全國產化算力,在“海能”人工智能模型平臺接入DeepSeek系列模型,通過私有化部署面向全集團提供開放服務。電網故障預測響應時間從分鐘級壓縮至秒級,需結合實時數據采集、高速算力支撐和智能算法優化,海光DCU的低延遲計算能力與DeepSeek模型的實時推理能力相結合,可滿足這一需求。

重構中國AI產業競爭力

技術突破顯著降低硬件門檻。DeepSeek通過MoE架構將激活參數量控制在合理范圍,V3.1的UE8M0 FP8精度標準使國產芯片在推理場景下的能效比提升40%。實測顯示,在671B參數規模下,沐曦曦云C500運行V3的單位算力成本較H100降低35%,推理延遲縮短至8ms以內。龍芯芯片在適配DeepSeek后,也憑借其架構優勢,在特定場景下實現了較低的功耗和較高的性價比,為國產AI應用的普及提供了更多選擇。

生態共建加速產業落地進程。華為云昇騰算力服務已承載超過7萬顆910B芯片,訂單價值超20億美元;海光DCU在金融行業市占率突破28%,其適配的DeepSeek模型日均調用量達4.7億次。龍芯在完成適配后,積極與眾多軟件廠商和系統集成商展開合作,推動基于龍芯芯片和DeepSeek模型的解決方案在更多行業落地。例如,在一些教育領域的智能教學系統中,龍芯芯片與DeepSeek模型結合,實現了智能答疑、個性化學習推薦等功能,提升了教學質量和效率。

技術差距縮短在具體領域表現突出。華為昇騰910C在推理性能上達到H100的60%,能效比優于后者;沐曦曦云C500成為首個支持70B參數大模型單卡推理的國產GPU。龍芯芯片在不斷研發和優化過程中,性能也在逐步提升,在一些特定的AI應用場景中,已經能夠滿足基本的需求,為中國在AI算力芯片等關鍵領域的自主化率提升貢獻了力量。

寫在最后

站在2025年的節點回望,DeepSeek V3.1的發布不僅是單一產品的迭代,更是中國AI產業生態重構的縮影。從技術參數的優化到產業生態的共建,從芯片算力的突破到應用場景的落地,中國AI正在走出一條不同于國際巨頭的自主化道路。隨著UE8M0 FP8標準成為行業新范式,隨著“模型+芯片+應用”生態的持續完善,中國AI產業有望在2030年前實現全球競爭力的實質性躍升。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度騰訊搶灘布局!DeepSeek-R1升級和開源背后,國產AI的逆襲之路

    最為顯著 ? DeepSeek-R1-0528仍然以2024年12月發布DeepSeek V3 Base模型為基座,通過在后訓練過程中投入更多
    的頭像 發表于 06-03 06:34 ?6185次閱讀

    DeepSeek一體機背后,國產芯片崛起

    DeepSeek-R1目前已經發布了1.5B/7B/8B/14B/32B/70B/671B共7類,選擇不同規格的硬件配置。 自2月份以來,已有多家芯片廠商宣布支持DeepSeek模型,
    的頭像 發表于 03-10 08:19 ?7436次閱讀
    <b class='flag-5'>DeepSeek</b>一體機背后,<b class='flag-5'>國產</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>崛起

    重磅更新 | 先楫半導體HPM_APPS v1.10.1發布

    重磅更新 | 先楫半導體HPM_APPS v1.10.1發布
    的頭像 發表于 12-26 08:33 ?859次閱讀
    重磅更新 | 先楫半導體HPM_APPS <b class='flag-5'>v</b>1.10.1<b class='flag-5'>發布</b>

    湘軍,讓變成生產

    腦極體
    發布于 :2025年11月25日 22:56:58

    國產AI芯片真能扛住“內卷”?海思昇騰的這波操作藏了多少細節?

    最近行業都在說“是AI的命門”,但國產芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預期——7nm工藝下
    發表于 10-27 13:12

    擁抱DeepSeek開源生態| 能TPU接入TileLang,集結北大復旦山大頂尖團隊!

    近日,DeepSeekV3.2-Exp上線,官宣支持國產AI算子編程語言TileLang并發布了針對V3.2的算子示例,這意味著支持“同一語義、跨多后端”的TileLang得到了權威認可,基于
    的頭像 發表于 10-03 19:08 ?1413次閱讀
    <b class='flag-5'>擁抱</b><b class='flag-5'>DeepSeek</b>開源生態| <b class='flag-5'>算</b>能TPU接入TileLang,集結北大復旦山大頂尖團隊!

    商湯大裝置Mall重磅發布

    近日,商湯科技聯合華為、庫帕思、海光、寒武紀、曦望Sunrise、壁仞科技、麒麟軟件、摩爾線程等十余家國產生態伙伴,共同發布“商湯大裝置Mall”。
    的頭像 發表于 08-05 10:05 ?1024次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    : NVlink1.0——初代的堆疊技術 英偉達2014發布了NVLink的首個版本——NVLink 1.0。在2016年發布的P100芯片上,首次搭載了NVLink 1.0技術。 NVlink1.0
    發表于 06-18 19:31

    AIGC基礎設施技術架構與行業實踐

    AIGC基礎設施技術架構與行業實踐 一、硬件層:AI的物理載體 芯片技術升級? 國際前沿?:某國際
    的頭像 發表于 05-29 07:44 ?940次閱讀
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基礎設施技術架構與行業實踐

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發布

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發布
    的頭像 發表于 05-13 11:29 ?1784次閱讀
    重磅更新 | 先楫半導體HPM_APPS <b class='flag-5'>v</b>1.9.0<b class='flag-5'>發布</b>

    DeepSeek創始人梁文鋒入選《時代》最具影響100人

    據外媒報道,美國《時代》周刊2025年全球100最具影響力人物正式公布了榜單。根據榜單數據顯示,DeepSeek創始人梁文鋒上榜。《時代》周刊這樣描述;DeepSeek于今年1月發布的生成式AI
    的頭像 發表于 04-19 11:21 ?1023次閱讀

    芯片的生態突圍與革命

    電子發燒友網報道(文 / 李彎彎)大芯片,即具備強大計算能力的集成電路芯片,主要應用于高性能計算(HPC)、人工智能(AI)、數據中心、自動駕駛等需要海量數據并行計算的場景。隨著
    的頭像 發表于 04-13 00:02 ?3240次閱讀

    DeepSeek推動AI需求:800G光模塊的關鍵作用

    隨著人工智能技術的飛速發展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓練與推理任務對的需求持續攀升,直接推動了服務
    發表于 03-25 12:00

    科通技術推出DeepSeek+AI芯片全場景方案

    份有限公司(以下簡稱“科通技術”)作為AI供應鏈的核心供應商,憑借深厚的技術積累與產業資源,推出了DeepSeek大模型與AI芯片相結合的全場景應用方案,在AI
    的頭像 發表于 03-24 10:33 ?1274次閱讀

    OrangePi RV2發布: 8核RISC-V AI CPU,“OpenHarmony5.0?X DeepSeek&amp;quot;引領智能未來

    RISC-VAICPU,提供2TOPSCPU融合的通用,即將支持OpenHarmony5.0,深度適配DeepSeek國產芯片+
    的頭像 發表于 03-10 13:35 ?1599次閱讀
    OrangePi RV2<b class='flag-5'>發布</b>: 8核RISC-<b class='flag-5'>V</b> AI CPU,“OpenHarmony5.0?X <b class='flag-5'>DeepSeek</b>&amp;quot;引領智能未來