玖玖操,亚洲中文久久久国产精品,国产精品成人亚州一区二区

2月2日，階躍星辰正式發布新一代開源Agent基座模型——Step 3.5 Flash，同時宣布華為昇騰、沐曦股份、壁仞科技、燧原科技、天數智芯、阿里平頭哥在內的多家芯片廠商已完成對該模型的適配。

Step 3.5 Flash模型聚焦于實時Agent工作流場景，采用稀疏MoE架構，總參數量高達1960億，不過每個token僅激活約110億參數。這種設計旨在兼顧推理速度與使用成本，為智能體（Agent）提供穩定可靠且高性價比的底層支撐，助力其實現高效規模化應用。

在實際性能表現上，該模型在推理能力與運行效率間取得了出色平衡。針對規模化Agent應用中存在的穩定性、延遲和成本瓶頸，它進行了專項優化，能夠滿足多步推理中的低延遲需求。在τ -Bench、BrowseComp等智能體能力測試，以及LiveCodeBench V6代碼挑戰和AIME 2025數學競賽中，Step 3.5 Flash均展現出優異表現，尤其在Agentic和數學任務上極具競爭力，已具備支持企業級應用落地的能力。

在實際應用場景中，Step 3.5 Flash更是展現出強大的自動編程與“端云協同”能力。例如，它可基于自然語言指令自動構建復雜可視化地理空間系統，還能將復雜需求拆解為子任務，協同本地設備完成數據分析與決策。并且，模型針對本地部署進行了性能優化，充分滿足數據隱私和本地算力應用需求。目前，該模型已在OpenRouter、GitHub、階躍AI APP及網頁端同步上線，面向開發者提供免費試用與快速部署支持。

此次適配并非簡單的讓模型在芯片上運行，而是通過算法 - 硬件協同設計，成功解決了大模型落地的三個核心痛點。

在推理速度優化方面，針對Step 3.5 Flash的MoE架構進行定制化編譯優化。在單請求代碼類任務中，實現了高達350 TPS的推理速度。華為昇騰和阿里平頭哥利用其異構計算架構（如CANN），專門優化了MoE架構中“路由”和“專家選擇”的計算效率，減少芯片內部數據搬運，最大化計算單元利用率。

在降本增效上，傳統大模型推理成本高昂，且在非頂級芯片上效率打折。而通過底層聯合創新，Step 3.5 Flash在這些國產芯片上的吞吐量大幅提升。在同類架構下，階躍的模型曾實現過比同類競品高70%甚至300%的推理效率。這意味著企業使用國產芯片部署階躍星辰的模型，能以更低的硬件投入獲得更高的產出，直接降低了商業化門檻。

廣泛的硬件兼容性也是此次適配的一大亮點。除了服務器端的華為、壁仞等芯片，適配工作還延伸到了端側。模型已支持在Apple M3/M4 Max、NVIDIA DGX Spark、AMD AI Max + 395等主流個人工作站上流暢運行。這表明階躍星辰的適配策略是“全棧全場景”的，既能在云端大算力集群運行，也能在個人電腦甚至邊端設備（如天數智芯的邊端產品）上運行。

此次適配陣容如此豪華，背后離不開“模芯生態創新聯盟”的推動。階躍星辰曾于2025年7月聯合多家芯片及基礎設施廠商發起該聯盟，旨在通過聯合優化提升算力效率，推動大模型在應用場景中的落地。此次模型發布正是其在模型與算力協同方向的進一步實踐。

對于芯片廠商而言，階躍星辰提供了頂尖的AI應用場景，有力證明了國產芯片的可用性；對于階躍星辰自身，則獲得了芯片底層的接口權限，能夠針對硬件特性對模型進行極致優化。這種“結盟”策略實現了雙方的互利共贏，也為整個科技行業的發展注入了新的活力。

階躍星辰新一代開源基座模型Step 3.5 Flash的發布以及與國產芯片的成功適配，無疑為大模型與國產芯片的協同發展樹立了新的標桿。未來，隨著技術的不斷進步和生態的持續完善，我們有理由期待更多創新成果的涌現，為智能時代的到來奠定堅實基礎。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI芯片

AI芯片

+關注

關注
17

文章
2126

瀏覽量
36770

搜索歷史

階躍星辰開源Step 3.5 Flash，多家國產芯片廠商完成適配

評論