
DeepSeek V3.2帶來的最大亮點,是Agent能力的升級。到底有哪些核心特性?
首先是架構創新,9月29日,DeepSeek V3.2實驗版發布,引入了DSA稀疏注意力機制,經過2個月的持續優化,12月1日推出正式版。DSA稀疏注意力機制可以實現高效率與高性能的平衡:顯著降低長文本處理的計算成本和延遲,使模型能更專注于深度推理。
DeepSeek 表示,V3.2 模型具備類人推理能力,并能自動調用搜索引擎、計算器與程序代碼執行器等工具,上下文的窗口擴展到128K,可以理解更長的文檔或者處理大型的數據分析。這是該公司首次讓模型同時支持“思考”與“非思考”兩種運行模式,并讓推理鏈與工具使用無縫結合。官方技術報告指出,V3.2 在多項 reasoning 基準中,與 Kimi-k2-thinking 與 GPT-5 表現相當。
DeepSeek V3.2 模型略低于Gemini-3.0-Pro,相比Kimi-K2-Thinking, V3.2的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。
值得關注的是,在硬件架構和企業支持方面,DeepSeek V3.2 模型不僅對英偉達的GPU做深度優化,讓其支持FP8的混合精度計算,整體效率提升40%,同時他對華為昇騰、寒武紀等國產芯片進行適配,第一時間支持了華為昇騰,還完成了對VRLM框架的對接,并且和寒武紀同步發布了適配的源代碼,確保在沐熙芯片上部署滿血版的模型。AMD官方專門為DeepSeek V3.2 XP做了針對GPU的優化,全志科技在芯片和軟件方面對DeepSeek進行了深度的協同。
另外,公司同步推出的 DeepSeek-V3.2-Speciale,其目標是將開源模型的推理能力推向極致,探索模型能力的邊界。它主攻數學運算、長鏈推理與高難度計算任務,其在國際數學奧林匹亞(IMO)與國際信息奧林匹亞(IOI)等標準化測試上達到金牌水平,并在功能上對標 Google 最新的 Gemini-3 Pro。
經過測試顯示,DeepSeek V3.2接近AI開源模型天花板級別,直接和頂級閉源AI大模型掰手腕。DeepSeek強調,在高度復雜任務上,Special模型大幅優于標準版本,但是消耗的Tokens也顯著增多,成本更高,現在并沒有開放給普通用戶。
本文由電子發燒友原創,轉載請注明以上來源。微信號zy1052625525。需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱zhangying@huaqiu.com。
-
AI大模型
+關注
關注
0文章
395瀏覽量
956 -
DeepSeek
+關注
關注
2文章
826瀏覽量
2861
發布評論請先 登錄
GPT-5震撼發布:AI領域的重大飛躍
奇異摩爾入選2025中國科創好公司半導體榜單
中科曙光AI超集群系統和scaleX640超節點等產品全面適配DeepSeek V3.2
寒武紀成功適配DeepSeek-V3.2-Exp模型

正面對決GPT-5和Germini-3,DeepSeek-V3.2震撼發布
評論