電子發(fā)燒友報道(文/黃晶晶)谷歌 TPU 對英偉達(dá) GPU 的直接競爭,引發(fā)市場廣泛關(guān)注。而如今,中國 AI 芯片領(lǐng)域也正加速布局,發(fā)力非GPU芯片突破。
12月2日,非GPU賽道的核心AI芯片公司清微智能宣布完成超20億元人民幣 C 輪融資。
本輪融資由北京市屬國企京能集團領(lǐng)投,北創(chuàng)投、建投投資、武岳峰科創(chuàng)、成都科創(chuàng)投、華泰紫金、智路資本、中南泊富、凱聯(lián)資本、圖靈資產(chǎn)、硬核堅果資本、拓鋒投資、米聚資本、允泰資本、和而泰、中科元創(chuàng)跟投,老股東京國瑞(北京信息產(chǎn)業(yè)發(fā)展投資基金)、中關(guān)村科學(xué)城公司、商湯國香資本、聞名投資、卓源亞洲、源余投資、考拉基金持續(xù)追投。
據(jù)悉,清微智能亦是國內(nèi)研發(fā)“非 GPU”新型架構(gòu) AI 芯片的代表企業(yè)。其研發(fā)的可重構(gòu)AI芯片既能夠保留GPU通用性的同時,通過算子的動態(tài)重構(gòu),趨近TPU等專用AI芯片的能效優(yōu)勢,也被稱為“通用型TPU”。
“我們正處在一個AI模型爆炸的年代,模型的迭代速度已經(jīng)從過去的以年、以月為單位,進(jìn)化到今天開始以周為單位進(jìn)行演進(jìn)。”在近期舉行的2025集成電路發(fā)展論壇(成渝)暨三十一屆集成電路設(shè)計業(yè)展覽會(ICCAD-Expo2025)上,清微智能副總裁陳逸倫表示,從GPT-5、Qwen到DeepSeek等大模型的快速迭代,背后是對計算能力永無止境的苛求。

圖:清微智能副總裁陳逸倫
陳逸倫表示,若按照當(dāng)前趨勢持續(xù)擴張,預(yù)計到2030年,全球前沿AI的算力集群成本將超過1000億美元。
成本降50%、能效升3倍,可重構(gòu)推進(jìn)國產(chǎn)AI算力
據(jù)悉,可重構(gòu)計算架構(gòu)技術(shù)兼具通用芯片靈活性與專用集成電路高效性的優(yōu)點,能根據(jù)不同的算法和應(yīng)用需求靈活配置硬件資源,帶來更高有效的算力和更低的功耗。《國際半導(dǎo)體技術(shù)路線圖》曾表示,可重構(gòu)技術(shù)是最具前景的未來計算架構(gòu)。
清微智能是全球少數(shù)將可重構(gòu)計算實現(xiàn)大規(guī)模產(chǎn)業(yè)化的公司,走出了與傳統(tǒng)GPU芯片完全不同的路徑,利用非先進(jìn)工藝達(dá)到同樣甚至更優(yōu)的能效和性能,并利用晶圓級芯片等創(chuàng)新技術(shù),不斷優(yōu)化芯片性能,并保持優(yōu)秀迭代能力。
作為源自清華大學(xué)的全球可重構(gòu)架構(gòu)計算領(lǐng)導(dǎo)者,清微智能已量產(chǎn)TX5邊緣算力系列、TX8云端算力系列等產(chǎn)品。
截至目前,清微智能可重構(gòu)芯片累計出貨量已經(jīng)超過3000萬顆。
在云端層面,清微智能可重構(gòu)AI芯片已在全國十余座千卡規(guī)模智算中心實現(xiàn)規(guī)模化落地,以獨特“C2C算力網(wǎng)格技術(shù)”為核心,構(gòu)建出高帶寬、低延遲的數(shù)據(jù)流通路。相較于依賴外部交換機的傳統(tǒng)方案,清微在擴展性、靈活性和傳輸效率上實現(xiàn)了架構(gòu)級的代際提升。
搭載TX81芯片的REX1032訓(xùn)推一體服務(wù)器可支持萬億以上參數(shù)大模型部署,整體解決方案成本相比同行業(yè)產(chǎn)品降低50%,能效比提升3倍。
根據(jù)IDC數(shù)據(jù),2025年上半年清微智能AI加速卡出貨量位列國產(chǎn)商用類企業(yè)“第一梯隊”。
“三層兼容”的可重構(gòu)算力軟件生態(tài)
清微智能的可重構(gòu)計算技術(shù)并非孤例,而是全球業(yè)界的共識性方向。
陳逸倫指出,從國外斯坦福孵化的Sambanova,還有采用類似的谷歌TPU,全世界頂尖科研機構(gòu)和公司都在這個方向上做持續(xù)探索。這表明可重構(gòu)計算已獲全球驗證,是通往未來的關(guān)鍵賽道。
在生態(tài)建設(shè)方面,面對“90% AI開發(fā)者仍習(xí)慣CUDA”的現(xiàn)實,清微智能采取了"三層兼容"策略,與傳統(tǒng)CUDA生態(tài)形成差異化優(yōu)勢。
其一是對國外生態(tài)的兼容,例如兼容CUDA API,像cuDNN(專為深度學(xué)習(xí)設(shè)計的庫)、cuBLAS(用于線性代數(shù)運算的庫)用戶都可以使用,清微智能和英偉達(dá)CUDA生態(tài)的兼容也在持續(xù)完善。還有一些主流的神經(jīng)網(wǎng)絡(luò)框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容適配,保證框架上編程用戶做到無感遷移。
其二是與特色生態(tài)建設(shè)。Triton是OpenAI主推的開源編譯器,行業(yè)內(nèi)主流大模型廠商都在向Triton做遷移,清微聯(lián)合智源研究院,積極參與國內(nèi)Triton生態(tài)的建設(shè)工作。
其三,可重構(gòu)芯片融合可重構(gòu)計算與RISC-V指令集架構(gòu),由于其底層兼容RISC-V指令集,用戶可以用RISC-V去做整個芯片的編程,便于性能調(diào)優(yōu)。
另外,像一些主流的神經(jīng)網(wǎng)絡(luò)框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容適配,保證框架上編程用戶做到無感遷移。因此,通過擁抱開源Triton+RISC-V生態(tài),同時也兼容CUDA,清微智能可以為不同類型客戶提供適配方式。
“我們希望能夠做到客戶是對底層架構(gòu)是無感知的,所以我們在中間做了相應(yīng)的封裝。"陳逸倫表示。
在產(chǎn)品規(guī)劃上,陳逸倫透露,明年公司計劃推出性能更高的TX82系列產(chǎn)品。
未來中國不應(yīng)錯過國產(chǎn)非GPU架構(gòu)窗口期
縱觀當(dāng)前國際廠商的芯片架構(gòu)迭代,往往采用先進(jìn)工藝提高晶體管密度、處理器架構(gòu)微調(diào)、增強帶寬等方式,而可重構(gòu)計算的優(yōu)勢是像搭積木一樣構(gòu)造電路,利用數(shù)據(jù)流的形式使得計算數(shù)據(jù)在芯片內(nèi)部單元流動,減少與外部存儲的交互。同時3D堆疊技術(shù)、晶圓級芯片也為可重構(gòu)計算架構(gòu)的發(fā)展提供很多新的思路。
關(guān)于技術(shù)迭代速度,陳逸倫認(rèn)為,清微智能的“可重構(gòu)架構(gòu)”計算是動態(tài)的,像搭積木一樣去構(gòu)造電路,并采用了數(shù)據(jù)流形式,計算時數(shù)據(jù)在芯片內(nèi)部單元流動,不會到顯存上頻繁做交互,因此能效可以超過同類產(chǎn)品。
陳逸倫進(jìn)一步強調(diào),“在我們看來,可重構(gòu)計算+3D Chiplet+晶圓級集成至少還可以探索很多年,這相當(dāng)于‘芯片界的電磁彈射’,每一步都在對軟件、硬件作重新定義,在這條路上有更廣闊的發(fā)展空間。”
事實上,國產(chǎn)替代、自主創(chuàng)新已經(jīng)是大勢所趨,且刻不容緩。而基于可重構(gòu)等新架構(gòu)國產(chǎn)AI加速卡芯片,已經(jīng)迎來了換道超車的最佳機遇。
“國產(chǎn)非GPU架構(gòu)窗口期只有兩年,錯過就不再。”陳逸倫直言,清微智能所代表的可重構(gòu)計算路徑,正為中國算力自主可控開辟出一條切實可行的創(chuàng)新之路。
發(fā)布評論請先 登錄
豪言自家芯片比英偉達(dá)GPU強10倍,這家AI公司再獲融資
英偉達(dá)失守中國區(qū)!推理需求爆發(fā),國產(chǎn)GPU搶灘上市
“四算合一”算力平臺,芯片國產(chǎn)化率超九成,兼容8種國產(chǎn)AI芯片
知行科技如何用小算力躋身第一梯隊
重磅獎項!清微智能斬獲2025安博會大獎,夯實國產(chǎn)AI算力第一梯隊
國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?
存算一體AI芯片公司九天睿芯完成超億元B輪融資
2025年中國工業(yè)機器人產(chǎn)業(yè)區(qū)域競爭梯隊分析(圖)
寶馬攜手Momenta共研中國專屬智能駕駛輔助系統(tǒng) 躋身智能駕駛體驗第一梯隊
融資超20億,這家“非GPU”芯片公司躋身國產(chǎn)AI算力第一梯隊
評論