日前,國產(chǎn)AI芯片企業(yè)太初(無錫)電子科技有限公司(又稱“太初元碁”)完成智譜GLM-5.0、阿里千問Qwen3.5-397B-A17B等大模型的深度適配,截至目前,其已完成包括DeepSeek、Qwen、GLM、Intern-S1、文心等在內(nèi)的40+AI大模型的即發(fā)即適配,上線即可用,涵蓋了DeepSeek、Qwen 、GLM、Seed-OSS、文心一言系列大語言模型、BAAI Embedding / Reranker系列向量模型、Qwen-VL、LLaVA系列多模態(tài)理解模型;Stable-Diffusion、FLUX、Wan系列等多模態(tài)生成類模型;MinerU、DeepSeek-OCR、Paddle-OCR等主流OCR模型;以及Intern-S1科學多模態(tài)大模型。
自2026年元旦以來,多家知名企業(yè)紛紛宣布更新國產(chǎn)大模型,大模型進入“周更”時代,而算力底座的響應速度也決定了生態(tài)話語權。換言之,留給國產(chǎn)AI芯片的時間并不多了。一位業(yè)內(nèi)人士表示,軟件定義硬件的趨勢日益明顯。“過去我們習慣的芯片設計流程是先集中全力把硬件設計出來,然后軟件團隊投入大量人力去建設和完善各種軟件棧將硬件性能發(fā)揮出來,實現(xiàn)軟硬件協(xié)同。但以DeepSeek、智譜、千問等大模型大規(guī)模成功應用,讓我們看到了變化。”
以太初元碁為例,除了在極短時間完成各大模型的快速適配之余,其也就軟硬件協(xié)同問題在持續(xù)發(fā)力。據(jù)介紹,在主流大模型適配過程中,太初元碁針對不同開發(fā)者的技術能力差異,在SDAA軟件棧中推出了階梯式開發(fā)工具鏈,全面覆蓋從入門到高階的多元化開發(fā)需求。該工具鏈能夠幫助開發(fā)者快速構建高性能算子,實現(xiàn)與主流AI生態(tài)的無縫兼容,顯著降低CUDA生態(tài)遷移的技術門檻與成本。
“一方面,面向不同開發(fā)者我們提供了多種開發(fā)高性能算子工具,比如SDAA Copilot、Teco-Triton、SDAA C以及PCX虛擬指令集等;另一方面,我們通過Teco-vLLM高度適配自研AI加速卡從而實現(xiàn)零成本兼容AI主流任務。”太初元碁相關負責人介紹道。據(jù)悉,SDAA Copilot專注于加速卡算子智能生成的AI編程大模型,小時級別生成3000個SDAA算子代碼生成并通過單測;開發(fā)者使用熟悉的Triton的Python抽象語法樹快速、靈活的編寫高性能算子,Teco-Triton后端無縫運行在太初元碁加速卡;SDAA編程模型支持C/C++標準語法,讓開發(fā)者可以直接使用進行內(nèi)核開發(fā);PCX虛擬指令集深度匹配太初元碁的硬件特性,支持用戶在SDAA C程序中嵌入PCX指令,實現(xiàn)對關鍵計算路徑的精細優(yōu)化。同時,Teco-vLLM通過插件機制,將太初AI加速卡接入vLLM框架,實現(xiàn)與原生vLLM完全一致的推理接口和方法,基于GPU開發(fā)的vLLM原生應用無需修改模型代碼和啟動方式,即可無縫遷移至太初元碁硬件運行,降低生態(tài)切換成本。
太初元碁首席產(chǎn)品官洪源在接受記者采訪時表示,突破集群性能、追求極致推理性價比、加速生態(tài)和軟件工具建設將成為國產(chǎn)AI芯片企業(yè)的三大主攻方向。“大模型訓練本質(zhì)上是大數(shù)據(jù)量的‘分布式并行計算’,互聯(lián)能力就是分布式計算的數(shù)據(jù)傳輸‘高速公路’。前沿大模型的訓練已經(jīng)要求數(shù)萬張算力卡的互聯(lián)并行工作,國產(chǎn)AI芯片廠商不能只關注單卡性能,需要充分考慮如何構建產(chǎn)品真正的集群性能,”洪源說道,“現(xiàn)階段對于大模型廠商和云服務廠商而言,每Token對應的成本將有可能決定產(chǎn)品的‘生死’,所以性價比將成為推理任務的極致追求。最后是生態(tài)的挑戰(zhàn),讓我們國產(chǎn)AI芯片在最終客戶側落地時,必須回答并徹底解決一個實際問題,如何幫助用戶甚至讓用戶無感的從CUDA生態(tài)遷移過來。”
在大模型沒有進入“周更”時代前,或許國產(chǎn)AI芯片企業(yè)還能放慢腳步,慢慢觀察再決定接下來要怎么走。然而,現(xiàn)在已然沒有太多的時間,國產(chǎn)算力企業(yè)真正的大考來臨,誰能真正拓展生態(tài),讓產(chǎn)品在具體場景下落地,才能在未來繼續(xù)“活”下來。
-
AI芯片
+關注
關注
17文章
2126瀏覽量
36771
發(fā)布評論請先 登錄
香橙派全志系列開發(fā)板適配OpenClaw教程
全棧國產(chǎn)AI Coding上線:摩爾線程+硅基流動+智譜,強強聯(lián)合!
蔚來世界模型NWM全新版本使用指南
蔚來世界模型NWM全新版本正式推送
中科曙光AI超集群系統(tǒng)和scaleX640超節(jié)點等產(chǎn)品全面適配DeepSeek V3.2
如何使用新版本J-Flash編程CW32 MCU
曙光AI超集群系統(tǒng)全面支持DeepSeek-V3.2-Exp
中科曙光助力紫東太初4.0大模型重磅發(fā)布
transcosmos在中國發(fā)布全渠道智能客服平臺"transCxLink"3.0版本
太初元碁:40+AI大模型全覆蓋,新版本即發(fā)即適配、上線即可用,實現(xiàn)國產(chǎn)“芯”速度
評論