2月2日,階躍星辰正式發布新一代開源Agent基座模型——Step 3.5 Flash,同時宣布華為昇騰、沐曦股份、壁仞科技、燧原科技、天數智芯、阿里平頭哥在內的多家芯片廠商已完成對該模型的適配。
Step 3.5 Flash模型聚焦于實時Agent工作流場景,采用稀疏MoE架構,總參數量高達1960億,不過每個token僅激活約110億參數。這種設計旨在兼顧推理速度與使用成本,為智能體(Agent)提供穩定可靠且高性價比的底層支撐,助力其實現高效規模化應用。
在實際性能表現上,該模型在推理能力與運行效率間取得了出色平衡。針對規模化Agent應用中存在的穩定性、延遲和成本瓶頸,它進行了專項優化,能夠滿足多步推理中的低延遲需求。在τ -Bench、BrowseComp等智能體能力測試,以及LiveCodeBench V6代碼挑戰和AIME 2025數學競賽中,Step 3.5 Flash均展現出優異表現,尤其在Agentic和數學任務上極具競爭力,已具備支持企業級應用落地的能力。
在實際應用場景中,Step 3.5 Flash更是展現出強大的自動編程與“端云協同”能力。例如,它可基于自然語言指令自動構建復雜可視化地理空間系統,還能將復雜需求拆解為子任務,協同本地設備完成數據分析與決策。并且,模型針對本地部署進行了性能優化,充分滿足數據隱私和本地算力應用需求。目前,該模型已在OpenRouter、GitHub、階躍AI APP及網頁端同步上線,面向開發者提供免費試用與快速部署支持。
此次適配并非簡單的讓模型在芯片上運行,而是通過算法 - 硬件協同設計,成功解決了大模型落地的三個核心痛點。
在推理速度優化方面,針對Step 3.5 Flash的MoE架構進行定制化編譯優化。在單請求代碼類任務中,實現了高達350 TPS的推理速度。華為昇騰和阿里平頭哥利用其異構計算架構(如CANN),專門優化了MoE架構中“路由”和“專家選擇”的計算效率,減少芯片內部數據搬運,最大化計算單元利用率。
在降本增效上,傳統大模型推理成本高昂,且在非頂級芯片上效率打折。而通過底層聯合創新,Step 3.5 Flash在這些國產芯片上的吞吐量大幅提升。在同類架構下,階躍的模型曾實現過比同類競品高70%甚至300%的推理效率。這意味著企業使用國產芯片部署階躍星辰的模型,能以更低的硬件投入獲得更高的產出,直接降低了商業化門檻。
廣泛的硬件兼容性也是此次適配的一大亮點。除了服務器端的華為、壁仞等芯片,適配工作還延伸到了端側。模型已支持在Apple M3/M4 Max、NVIDIA DGX Spark、AMD AI Max + 395等主流個人工作站上流暢運行。這表明階躍星辰的適配策略是“全棧全場景”的,既能在云端大算力集群運行,也能在個人電腦甚至邊端設備(如天數智芯的邊端產品)上運行。
此次適配陣容如此豪華,背后離不開“模芯生態創新聯盟”的推動。階躍星辰曾于2025年7月聯合多家芯片及基礎設施廠商發起該聯盟,旨在通過聯合優化提升算力效率,推動大模型在應用場景中的落地。此次模型發布正是其在模型與算力協同方向的進一步實踐。
對于芯片廠商而言,階躍星辰提供了頂尖的AI應用場景,有力證明了國產芯片的可用性;對于階躍星辰自身,則獲得了芯片底層的接口權限,能夠針對硬件特性對模型進行極致優化。這種“結盟”策略實現了雙方的互利共贏,也為整個科技行業的發展注入了新的活力。
階躍星辰新一代開源基座模型Step 3.5 Flash的發布以及與國產芯片的成功適配,無疑為大模型與國產芯片的協同發展樹立了新的標桿。未來,隨著技術的不斷進步和生態的持續完善,我們有理由期待更多創新成果的涌現,為智能時代的到來奠定堅實基礎。
Step 3.5 Flash模型聚焦于實時Agent工作流場景,采用稀疏MoE架構,總參數量高達1960億,不過每個token僅激活約110億參數。這種設計旨在兼顧推理速度與使用成本,為智能體(Agent)提供穩定可靠且高性價比的底層支撐,助力其實現高效規模化應用。
在實際性能表現上,該模型在推理能力與運行效率間取得了出色平衡。針對規模化Agent應用中存在的穩定性、延遲和成本瓶頸,它進行了專項優化,能夠滿足多步推理中的低延遲需求。在τ -Bench、BrowseComp等智能體能力測試,以及LiveCodeBench V6代碼挑戰和AIME 2025數學競賽中,Step 3.5 Flash均展現出優異表現,尤其在Agentic和數學任務上極具競爭力,已具備支持企業級應用落地的能力。
在實際應用場景中,Step 3.5 Flash更是展現出強大的自動編程與“端云協同”能力。例如,它可基于自然語言指令自動構建復雜可視化地理空間系統,還能將復雜需求拆解為子任務,協同本地設備完成數據分析與決策。并且,模型針對本地部署進行了性能優化,充分滿足數據隱私和本地算力應用需求。目前,該模型已在OpenRouter、GitHub、階躍AI APP及網頁端同步上線,面向開發者提供免費試用與快速部署支持。
此次適配并非簡單的讓模型在芯片上運行,而是通過算法 - 硬件協同設計,成功解決了大模型落地的三個核心痛點。
在推理速度優化方面,針對Step 3.5 Flash的MoE架構進行定制化編譯優化。在單請求代碼類任務中,實現了高達350 TPS的推理速度。華為昇騰和阿里平頭哥利用其異構計算架構(如CANN),專門優化了MoE架構中“路由”和“專家選擇”的計算效率,減少芯片內部數據搬運,最大化計算單元利用率。
在降本增效上,傳統大模型推理成本高昂,且在非頂級芯片上效率打折。而通過底層聯合創新,Step 3.5 Flash在這些國產芯片上的吞吐量大幅提升。在同類架構下,階躍的模型曾實現過比同類競品高70%甚至300%的推理效率。這意味著企業使用國產芯片部署階躍星辰的模型,能以更低的硬件投入獲得更高的產出,直接降低了商業化門檻。
廣泛的硬件兼容性也是此次適配的一大亮點。除了服務器端的華為、壁仞等芯片,適配工作還延伸到了端側。模型已支持在Apple M3/M4 Max、NVIDIA DGX Spark、AMD AI Max + 395等主流個人工作站上流暢運行。這表明階躍星辰的適配策略是“全棧全場景”的,既能在云端大算力集群運行,也能在個人電腦甚至邊端設備(如天數智芯的邊端產品)上運行。
此次適配陣容如此豪華,背后離不開“模芯生態創新聯盟”的推動。階躍星辰曾于2025年7月聯合多家芯片及基礎設施廠商發起該聯盟,旨在通過聯合優化提升算力效率,推動大模型在應用場景中的落地。此次模型發布正是其在模型與算力協同方向的進一步實踐。
對于芯片廠商而言,階躍星辰提供了頂尖的AI應用場景,有力證明了國產芯片的可用性;對于階躍星辰自身,則獲得了芯片底層的接口權限,能夠針對硬件特性對模型進行極致優化。這種“結盟”策略實現了雙方的互利共贏,也為整個科技行業的發展注入了新的活力。
階躍星辰新一代開源基座模型Step 3.5 Flash的發布以及與國產芯片的成功適配,無疑為大模型與國產芯片的協同發展樹立了新的標桿。未來,隨著技術的不斷進步和生態的持續完善,我們有理由期待更多創新成果的涌現,為智能時代的到來奠定堅實基礎。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI芯片
+關注
關注
17文章
2126瀏覽量
36770
發布評論請先 登錄
相關推薦
熱點推薦
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
今日,通義千問團隊正式開源發布Qwen3.5系列中等規模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3
摩爾線程MTT S5000全面適配Qwen3.5三款新模型
第一時間做出極速響應,宣布已在旗艦級AI訓推一體全功能GPU MTT S5000上,完成對這三款全新模型的全方位適配。 ? 此次高效支持充分展示了摩爾線程MUSA生態的成熟度與完備性。在本次Qwen3.5
摩爾線程快速完成對Qwen3.5模型全面適配
2月17日,摩爾線程宣布已在旗艦級AI訓推一體全功能GPU MTT S5000上完成對阿里最新大模型Qwen3.5的全方位適配。此次支持充分展示了摩爾線程MUSA生態的成熟度與完備性,開發者可通過
發表于 02-18 08:32
?168次閱讀
壁仞科技與階躍星辰及上海儀電智算服務成立人工智能聯合實驗室
2月2日,壁仞科技(06082.HK)與上海儀電旗下智算服務、階躍星辰攜手打造的人工智能聯合實驗室正式揭牌。人工智能聯合實驗室積極響應國家“自主可控、安全可靠”的人工智能發展戰略,以技術共創、行業拓展、生態聚合為主要方向,共同推進“國芯、國模、國用”三位一體、協同創新的產
[工具討論] 如果有一款國產圖形化配置工具STM32Cube,支持所有內核和廠商MCU,你會用嗎?
涉及多家廠商芯片時,要在多個工具間切換
如果有一款這樣的工具
我們想和大家討論一個假設性問題:
如果有一款國產的圖形化配置工具,具備以下特性,你會考慮使用嗎?
核心特性對比
對比維度
發表于 01-26 10:30
壁仞科技與階躍星辰、上海儀電智算服務達成戰略合作
12月18日,壁仞科技、階躍星辰、上海儀電智算服務正式簽署戰略合作協議。本次戰略合作簽約,將進一步實現三家企業的優勢互補,持續探索技術創新與模式突破,構建起從底層硬件到上層應用的國產自主可控產業閉環,為上海乃至國家人工智能生態繁
澎峰科技完成OpenAI最新開源推理模型適配
澎峰科技現已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機上的原生適配與優化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企業級 AI 生產力!
華為CANN與智譜GLM端側模型完成適配
已于7月28日正式開源其新一代基座模型GLM-4.5,其GLM端側模型已完成與CANN的適配。這標志著國產大模型與計算架構在端云協同方向實現關鍵突破,
階躍星辰和燧原科技亮相WAIC 2025
近日,2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)在上海開幕。開幕前夕,中國AI大模型頭部企業階躍星辰發布新一代基礎大模型Step 3,并發起橫跨模型、芯片
寒武紀聯手階躍星辰成立模芯生態創新聯盟
近日,階躍星辰發布了新一代基礎大模型Step 3。Step 3兼顧智能與效率,通過模型和系統聯合創新,實現了行業前列的推理解碼效率,將于7月31日面向全球企業和開發者
燧原科技加入階躍星辰模芯生態創新聯盟
近日,階躍星辰在上海召開「Step 3大模型發布會暨生態聯盟成立大會」,會上階躍發布了新一代基礎大模型Step 3,旨在面向推理時代打造最適
開源系統適配:聚徽分享國產工控平板在 Linux / 鴻蒙系統下的技術優化
在工業自動化與智能化加速推進的當下,國產工控平板的系統適配成為提升設備性能與競爭力的關鍵環節。Linux 和鴻蒙作為開源系統,憑借其高度的開放性與可定制性,為國產工控平板帶來新的發展機
階躍星辰開源Step 3.5 Flash,多家國產芯片廠商完成適配
評論