電子發燒友報道(文/黃晶晶)谷歌 TPU 對英偉達 GPU 的直接競爭,引發市場廣泛關注。而如今,中國 AI 芯片領域也正加速布局,發力非GPU芯片突破。
12月2日,非GPU賽道的核心AI芯片公司清微智能宣布完成超20億元人民幣 C 輪融資。
本輪融資由北京市屬國企京能集團領投,北創投、建投投資、武岳峰科創、成都科創投、華泰紫金、智路資本、中南泊富、凱聯資本、圖靈資產、硬核堅果資本、拓鋒投資、米聚資本、允泰資本、和而泰、中科元創跟投,老股東京國瑞(北京信息產業發展投資基金)、中關村科學城公司、商湯國香資本、聞名投資、卓源亞洲、源余投資、考拉基金持續追投。
據悉,清微智能亦是國內研發“非 GPU”新型架構 AI 芯片的代表企業。其研發的可重構AI芯片既能夠保留GPU通用性的同時,通過算子的動態重構,趨近TPU等專用AI芯片的能效優勢,也被稱為“通用型TPU”。
“我們正處在一個AI模型爆炸的年代,模型的迭代速度已經從過去的以年、以月為單位,進化到今天開始以周為單位進行演進。”在近期舉行的2025集成電路發展論壇(成渝)暨三十一屆集成電路設計業展覽會(ICCAD-Expo2025)上,清微智能副總裁陳逸倫表示,從GPT-5、Qwen到DeepSeek等大模型的快速迭代,背后是對計算能力永無止境的苛求。

圖:清微智能副總裁陳逸倫
陳逸倫表示,若按照當前趨勢持續擴張,預計到2030年,全球前沿AI的算力集群成本將超過1000億美元。
成本降50%、能效升3倍,可重構推進國產AI算力
據悉,可重構計算架構技術兼具通用芯片靈活性與專用集成電路高效性的優點,能根據不同的算法和應用需求靈活配置硬件資源,帶來更高有效的算力和更低的功耗。《國際半導體技術路線圖》曾表示,可重構技術是最具前景的未來計算架構。
清微智能是全球少數將可重構計算實現大規模產業化的公司,走出了與傳統GPU芯片完全不同的路徑,利用非先進工藝達到同樣甚至更優的能效和性能,并利用晶圓級芯片等創新技術,不斷優化芯片性能,并保持優秀迭代能力。
作為源自清華大學的全球可重構架構計算領導者,清微智能已量產TX5邊緣算力系列、TX8云端算力系列等產品。
截至目前,清微智能可重構芯片累計出貨量已經超過3000萬顆。
在云端層面,清微智能可重構AI芯片已在全國十余座千卡規模智算中心實現規模化落地,以獨特“C2C算力網格技術”為核心,構建出高帶寬、低延遲的數據流通路。相較于依賴外部交換機的傳統方案,清微在擴展性、靈活性和傳輸效率上實現了架構級的代際提升。
搭載TX81芯片的REX1032訓推一體服務器可支持萬億以上參數大模型部署,整體解決方案成本相比同行業產品降低50%,能效比提升3倍。
根據IDC數據,2025年上半年清微智能AI加速卡出貨量位列國產商用類企業“第一梯隊”。
“三層兼容”的可重構算力軟件生態
清微智能的可重構計算技術并非孤例,而是全球業界的共識性方向。
陳逸倫指出,從國外斯坦福孵化的Sambanova,還有采用類似的谷歌TPU,全世界頂尖科研機構和公司都在這個方向上做持續探索。這表明可重構計算已獲全球驗證,是通往未來的關鍵賽道。
在生態建設方面,面對“90% AI開發者仍習慣CUDA”的現實,清微智能采取了"三層兼容"策略,與傳統CUDA生態形成差異化優勢。
其一是對國外生態的兼容,例如兼容CUDA API,像cuDNN(專為深度學習設計的庫)、cuBLAS(用于線性代數運算的庫)用戶都可以使用,清微智能和英偉達CUDA生態的兼容也在持續完善。還有一些主流的神經網絡框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容適配,保證框架上編程用戶做到無感遷移。
其二是與特色生態建設。Triton是OpenAI主推的開源編譯器,行業內主流大模型廠商都在向Triton做遷移,清微聯合智源研究院,積極參與國內Triton生態的建設工作。
其三,可重構芯片融合可重構計算與RISC-V指令集架構,由于其底層兼容RISC-V指令集,用戶可以用RISC-V去做整個芯片的編程,便于性能調優。
另外,像一些主流的神經網絡框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容適配,保證框架上編程用戶做到無感遷移。因此,通過擁抱開源Triton+RISC-V生態,同時也兼容CUDA,清微智能可以為不同類型客戶提供適配方式。
“我們希望能夠做到客戶是對底層架構是無感知的,所以我們在中間做了相應的封裝。"陳逸倫表示。
在產品規劃上,陳逸倫透露,明年公司計劃推出性能更高的TX82系列產品。
未來中國不應錯過國產非GPU架構窗口期
縱觀當前國際廠商的芯片架構迭代,往往采用先進工藝提高晶體管密度、處理器架構微調、增強帶寬等方式,而可重構計算的優勢是像搭積木一樣構造電路,利用數據流的形式使得計算數據在芯片內部單元流動,減少與外部存儲的交互。同時3D堆疊技術、晶圓級芯片也為可重構計算架構的發展提供很多新的思路。
關于技術迭代速度,陳逸倫認為,清微智能的“可重構架構”計算是動態的,像搭積木一樣去構造電路,并采用了數據流形式,計算時數據在芯片內部單元流動,不會到顯存上頻繁做交互,因此能效可以超過同類產品。
陳逸倫進一步強調,“在我們看來,可重構計算+3D Chiplet+晶圓級集成至少還可以探索很多年,這相當于‘芯片界的電磁彈射’,每一步都在對軟件、硬件作重新定義,在這條路上有更廣闊的發展空間。”
事實上,國產替代、自主創新已經是大勢所趨,且刻不容緩。而基于可重構等新架構國產AI加速卡芯片,已經迎來了換道超車的最佳機遇。
“國產非GPU架構窗口期只有兩年,錯過就不再。”陳逸倫直言,清微智能所代表的可重構計算路徑,正為中國算力自主可控開辟出一條切實可行的創新之路。
發布評論請先 登錄
豪言自家芯片比英偉達GPU強10倍,這家AI公司再獲融資
知行科技如何用小算力躋身第一梯隊
重磅獎項!清微智能斬獲2025安博會大獎,夯實國產AI算力第一梯隊
國產AI芯片真能扛住“算力內卷”?海思昇騰的這波操作藏了多少細節?
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
2025年中國工業機器人產業區域競爭梯隊分析(圖)
寶馬攜手Momenta共研中國專屬智能駕駛輔助系統 躋身智能駕駛體驗第一梯隊
融資超20億,這家“非GPU”芯片公司躋身國產AI算力第一梯隊
評論