
DeepSeek V3.2帶來(lái)的最大亮點(diǎn),是Agent能力的升級(jí)。到底有哪些核心特性?
首先是架構(gòu)創(chuàng)新,9月29日,DeepSeek V3.2實(shí)驗(yàn)版發(fā)布,引入了DSA稀疏注意力機(jī)制,經(jīng)過(guò)2個(gè)月的持續(xù)優(yōu)化,12月1日推出正式版。DSA稀疏注意力機(jī)制可以實(shí)現(xiàn)高效率與高性能的平衡:顯著降低長(zhǎng)文本處理的計(jì)算成本和延遲,使模型能更專注于深度推理。
DeepSeek 表示,V3.2 模型具備類人推理能力,并能自動(dòng)調(diào)用搜索引擎、計(jì)算器與程序代碼執(zhí)行器等工具,上下文的窗口擴(kuò)展到128K,可以理解更長(zhǎng)的文檔或者處理大型的數(shù)據(jù)分析。這是該公司首次讓模型同時(shí)支持“思考”與“非思考”兩種運(yùn)行模式,并讓推理鏈與工具使用無(wú)縫結(jié)合。官方技術(shù)報(bào)告指出,V3.2 在多項(xiàng) reasoning 基準(zhǔn)中,與 Kimi-k2-thinking 與 GPT-5 表現(xiàn)相當(dāng)。
DeepSeek V3.2 模型略低于Gemini-3.0-Pro,相比Kimi-K2-Thinking, V3.2的輸出長(zhǎng)度大幅降低,顯著減少了計(jì)算開銷與用戶等待時(shí)間。
值得關(guān)注的是,在硬件架構(gòu)和企業(yè)支持方面,DeepSeek V3.2 模型不僅對(duì)英偉達(dá)的GPU做深度優(yōu)化,讓其支持FP8的混合精度計(jì)算,整體效率提升40%,同時(shí)他對(duì)華為昇騰、寒武紀(jì)等國(guó)產(chǎn)芯片進(jìn)行適配,第一時(shí)間支持了華為昇騰,還完成了對(duì)VRLM框架的對(duì)接,并且和寒武紀(jì)同步發(fā)布了適配的源代碼,確保在沐熙芯片上部署滿血版的模型。AMD官方專門為DeepSeek V3.2 XP做了針對(duì)GPU的優(yōu)化,全志科技在芯片和軟件方面對(duì)DeepSeek進(jìn)行了深度的協(xié)同。
另外,公司同步推出的 DeepSeek-V3.2-Speciale,其目標(biāo)是將開源模型的推理能力推向極致,探索模型能力的邊界。它主攻數(shù)學(xué)運(yùn)算、長(zhǎng)鏈推理與高難度計(jì)算任務(wù),其在國(guó)際數(shù)學(xué)奧林匹亞(IMO)與國(guó)際信息奧林匹亞(IOI)等標(biāo)準(zhǔn)化測(cè)試上達(dá)到金牌水平,并在功能上對(duì)標(biāo) Google 最新的 Gemini-3 Pro。
經(jīng)過(guò)測(cè)試顯示,DeepSeek V3.2接近AI開源模型天花板級(jí)別,直接和頂級(jí)閉源AI大模型掰手腕。DeepSeek強(qiáng)調(diào),在高度復(fù)雜任務(wù)上,Special模型大幅優(yōu)于標(biāo)準(zhǔn)版本,但是消耗的Tokens也顯著增多,成本更高,現(xiàn)在并沒(méi)有開放給普通用戶。
本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來(lái)源。微信號(hào)zy1052625525。需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱zhangying@huaqiu.com。
-
AI大模型
+關(guān)注
關(guān)注
0文章
400瀏覽量
1025 -
DeepSeek
+關(guān)注
關(guān)注
2文章
837瀏覽量
3326
發(fā)布評(píng)論請(qǐng)先 登錄
DeepSeek V3.1發(fā)布!擁抱國(guó)產(chǎn)算力芯片
GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍
0.7元/百萬(wàn)token碾壓競(jìng)品! 小米新開源大模型,卷出AI普惠關(guān)鍵密碼
奇異摩爾入選2025中國(guó)科創(chuàng)好公司半導(dǎo)體榜單
中科曙光AI超集群系統(tǒng)和scaleX640超節(jié)點(diǎn)等產(chǎn)品全面適配DeepSeek V3.2
寒武紀(jì)成功適配DeepSeek-V3.2-Exp模型
曙光AI超集群系統(tǒng)全面支持DeepSeek-V3.2-Exp
OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價(jià)向美國(guó)政府提供ChatGPT
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】--全書概覽
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書籍介紹+第一章讀后心得
【書籍評(píng)測(cè)活動(dòng)NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘
摩爾線程GPU成功適配Deepseek-V3-0324大模型
正面對(duì)決GPT-5和Germini-3,DeepSeek-V3.2震撼發(fā)布
評(píng)論