在人工智能加速落地的當(dāng)下,企業(yè)部署大模型仍面臨成本高昂、性能瓶頸與數(shù)據(jù)安全等多重挑戰(zhàn)。澎峰科技自推出 Deep Fusion 智算一體機(jī)水冷版 以來,持續(xù)深耕軟硬件協(xié)同優(yōu)化,致力于為中小企業(yè)打造高性價(jià)比、高穩(wěn)定性的AI基礎(chǔ)設(shè)施。
關(guān)于Qwen3.5系列模型
Qwen3.5-35B-A3B是阿里千問團(tuán)隊(duì)于2026年2月發(fā)布的中等規(guī)模MoE模型,憑借創(chuàng)新的混合注意力機(jī)制與高稀疏MoE架構(gòu),總參數(shù)達(dá)350億,但每次推理僅激活約30億參數(shù),實(shí)現(xiàn)了“大模型質(zhì)量、小模型成本”的突破。該模型在指令遵循、博士級(jí)推理、數(shù)學(xué)推理等多個(gè)權(quán)威榜單上表現(xiàn)超越前代更大尺寸的Qwen3-235B旗艦?zāi)P停?yōu)于GPT-5 mini等競品。同時(shí),Qwen3.5-35B-A3B支持高達(dá)100萬tokens的超長上下文,可通過量化部署于消費(fèi)級(jí)顯卡,對(duì)開發(fā)者極為友好。
近日,DF系列一體機(jī)水冷版已成功完成對(duì)Qwen3.5-35B-A3B模型的全面適配與性能調(diào)優(yōu)。本次適配基于自研PerfXLM推理框架的新版本(V1.1),針對(duì)該模型在多個(gè)并發(fā)場景下的Token生成速度、首字延遲、顯存及內(nèi)存占用等關(guān)鍵指標(biāo)進(jìn)行了全面測試。
測試數(shù)據(jù)(模型:Qwen3.5-35B-A3B 浮點(diǎn)FP16版本,測試規(guī)模:2K輸入、2K輸出)如下:


DF系列一體機(jī)水冷版自發(fā)布以來,憑借軟硬件深度協(xié)同的設(shè)計(jì)理念,實(shí)現(xiàn)了高性能與低成本的統(tǒng)一。此次Qwen3.5系列模型的成功適配,不僅是DF系列一體機(jī)水冷版產(chǎn)品能力的一次重要躍升,更是澎峰科技推動(dòng)大模型私有化部署“標(biāo)準(zhǔn)化基礎(chǔ)設(shè)施”進(jìn)程中的又一關(guān)鍵里程碑。
未來,澎峰科技將持續(xù)深化模型適配與推理引擎優(yōu)化,持續(xù)擴(kuò)大 Deep Fusion 智算一體機(jī)水冷版 對(duì)主流大模型的支持范圍,以更低門檻、更高效率,賦能千行百業(yè)加速邁入大模型私有化部署的新階段。
-
一體機(jī)
+關(guān)注
關(guān)注
0文章
1331瀏覽量
34857 -
模型
+關(guān)注
關(guān)注
1文章
3805瀏覽量
52232 -
澎峰科技
+關(guān)注
關(guān)注
0文章
83瀏覽量
3752
原文標(biāo)題:DF系列一體機(jī)水冷版完成Qwen3.5系列模型適配,大模型私有化部署再進(jìn)一步
文章出處:【微信號(hào):perfxlab,微信公眾號(hào):perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
阿里云發(fā)布新一代千問Qwen3.6-Plus,媲美Claude系列最強(qiáng)模型
海光DCU完成Qwen3.5多模態(tài)MoE模型全量適配
天數(shù)智芯完成阿里云通義千問Qwen3.5系列多模態(tài)模型全量適配
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
美格智能高算力AI模組+Qwen3.5,打造端側(cè)最強(qiáng)AI智能體
摩爾線程MTT S5000全面適配Qwen3.5三款新模型
摩爾線程快速完成對(duì)Qwen3.5模型全面適配
潤和軟件入選大模型一體機(jī)產(chǎn)業(yè)圖譜
澎峰科技最新推出Deep Fusion DF35智算一體機(jī)
澎峰科技完成OpenAI最新開源推理模型適配
遠(yuǎn)景達(dá)掃碼模組適用于觸摸一體機(jī)終端的型號(hào)
澎峰科技DF系列一體機(jī)水冷版完成Qwen3.5系列模型適配
評(píng)論