電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)要問2023世界人工智能大會(huì)(WAIC)上什么應(yīng)用最火,想來答案就是生成式AI和AI大模型,無論是專業(yè)會(huì)議還是展品,基本都是圍繞這兩項(xiàng)展開。對(duì)于生成式AI和AI大模型而言,核心三要素是算法、數(shù)據(jù)和算力,其中算力是底座。
對(duì)于算力而言,目前行業(yè)基本的共識(shí)是基于通用GPU來構(gòu)建AI大模型的算力集群,上海天數(shù)智芯半導(dǎo)體有限公司(以下簡(jiǎn)稱:天數(shù)智芯)是目前國(guó)內(nèi)第一家實(shí)現(xiàn)通用GPU量產(chǎn)并落地的公司。在WAIC上,天數(shù)智芯展示了通用GPU訓(xùn)練產(chǎn)品“天垓100”和推理產(chǎn)品“智鎧100”,以及基于兩款芯片落地的超過20+行業(yè)方案,其中當(dāng)然也包括AI大模型的訓(xùn)練和推理案例。
天數(shù)智芯董事長(zhǎng)兼CEO蓋魯江在接受電子發(fā)燒友網(wǎng)等媒體采訪時(shí)表示:“目前,天數(shù)智芯的‘天垓100’產(chǎn)品已經(jīng)跑通近500個(gè)模型,包括清華大學(xué)的GLM模型、Meta的LLamA模型、北京智源人工智能研究院Aquila模型等。智源研究院當(dāng)前已經(jīng)跑通的大模型是70億參數(shù)規(guī)模,650億參數(shù)規(guī)模的大模型也正在基于天數(shù)智芯天垓‘100’進(jìn)行訓(xùn)練,預(yù)計(jì)將會(huì)于今年的10月份完成。”

蓋魯江指出:“這些案例充分地證明了,天數(shù)智芯的國(guó)產(chǎn)通用GPU能夠適配國(guó)內(nèi)公司推出的大模型產(chǎn)品,也能夠滿足垂直行業(yè)方案在推理方面的需求。我們也在更新迭代自己的產(chǎn)品,預(yù)計(jì)在今年第四季度或者明年初將會(huì)有新品推出,針對(duì)大模型算法做硬件級(jí)的優(yōu)化,實(shí)現(xiàn)算力通用性和芯片性能的全面提升。”
從行業(yè)發(fā)展現(xiàn)狀來看,目前在國(guó)產(chǎn)通用GPU方面,天數(shù)智芯處于領(lǐng)先的位置。那么,要做好國(guó)產(chǎn)通用GPU需要具備哪些要素呢?而后續(xù)國(guó)產(chǎn)通用GPU優(yōu)化的方向是什么呢?
打造國(guó)產(chǎn)通用GPU,團(tuán)隊(duì)很重要
產(chǎn)業(yè)界真正提出通用GPU這個(gè)概念是在2003年,此后不斷強(qiáng)化其通用性,逐漸和圖形GPU有了明顯的差別。由于具有高并發(fā)性、高吞吐量以及可編程的能力,目前通用GPU成為產(chǎn)業(yè)界提供算力的主要手段。
蓋魯江在受訪時(shí)談到,要做好國(guó)產(chǎn)通用GPU,團(tuán)隊(duì)是非常重要的,且需要一支完整的有做過大芯片經(jīng)驗(yàn)的團(tuán)隊(duì)。
他對(duì)此說到:“通用GPU設(shè)計(jì)需要研發(fā)團(tuán)隊(duì)具備工程設(shè)計(jì)的經(jīng)驗(yàn)和能力,才能夠?qū)⑵湓O(shè)計(jì)出來。舉例來說,天數(shù)智芯通用GPU產(chǎn)品其中一個(gè)賣點(diǎn)是全自主IP,也就是說IP是由我們團(tuán)隊(duì)自己設(shè)計(jì)的,保證了產(chǎn)品的穩(wěn)定供應(yīng),其中涉及了IP的設(shè)計(jì)和驗(yàn)證,一個(gè)有多年合作經(jīng)驗(yàn)的團(tuán)隊(duì)能夠在流片前杜絕IP帶來的風(fēng)險(xiǎn)。”
“其二是要傾聽客戶,通用GPU算力、精度和性能的提升都是基于經(jīng)驗(yàn),而經(jīng)驗(yàn)的來源就是客戶應(yīng)用的反饋。只有客戶將產(chǎn)品用起來了,才能夠知道哪些方面做得好,可以在下一代產(chǎn)品中繼續(xù)沿用,哪些方面是需要在下一代產(chǎn)品中著重優(yōu)化。”蓋魯江稱。
談到通用GPU產(chǎn)品的升級(jí)迭代,蓋魯江提到了四大方向:
·計(jì)算單元的優(yōu)化,這是通用GPU一切性能提升的核心。通用GPU多核并行計(jì)算的特性決定了,如果單核性能得到提升,系統(tǒng)性能將會(huì)有明顯的改進(jìn)。
·集群化管理能力的提升,未來的通用GPU一定是以千卡、萬卡集群的方式來提供算力,卡與卡之間的互聯(lián)技術(shù)需要重點(diǎn)優(yōu)化。
·借助先進(jìn)封裝的創(chuàng)新力量,包括Chiplet、3D封裝這樣的技術(shù),未來的算力需求需要從系統(tǒng)層面去解決。
·針對(duì)具體應(yīng)用去做突破,通用GPU的“通用性”使其不能單純只講芯片,需要結(jié)合具體的應(yīng)用優(yōu)化芯片。
走兼容國(guó)際主流的生態(tài)路線
2022年8月30日,天數(shù)智芯正式發(fā)布國(guó)內(nèi)首個(gè)通用計(jì)算應(yīng)用開發(fā)及評(píng)測(cè)平臺(tái)——DeepSpark,通過分享與落地應(yīng)用深度耦合的百大算法,并針對(duì)行業(yè)需求構(gòu)建多維度測(cè)評(píng)體系,廣泛支持各類落地場(chǎng)景,讓算力選擇不再困難,更好賦能通用計(jì)算應(yīng)用開發(fā)。
DeepSpark平臺(tái)是天數(shù)智芯構(gòu)建國(guó)產(chǎn)通用GPU生態(tài)的重要一步。確實(shí),如蓋魯江所言,通用GPU產(chǎn)品是不能脫離應(yīng)用談芯片的。他表示:“國(guó)際領(lǐng)先廠商多年來一直在構(gòu)建自己的軟件生態(tài),并取得顯著的效果,在人工智能、元宇宙和大模型浪潮中,這家廠商的軟件生態(tài)都能對(duì)硬件應(yīng)用起到很好的帶動(dòng)效果。”
“對(duì)于天數(shù)智芯而言,生態(tài)建設(shè)的第一步就是兼容國(guó)際主流生態(tài)。基于天數(shù)智芯的通用GPU做軟件棧的開發(fā),然后在API接口層面兼容國(guó)際主流生態(tài),讓客戶能夠很快地將天數(shù)智芯的通用GPU用起來,實(shí)現(xiàn)更低的遷移成本。”蓋魯江對(duì)此說。
據(jù)介紹,目前天數(shù)智芯的團(tuán)隊(duì)規(guī)模在500多人,其中硬件和軟件工程師的比例大概是1:2。
后記
在國(guó)產(chǎn)通用GPU這個(gè)領(lǐng)域,天數(shù)智芯起步較早,并且是目前國(guó)內(nèi)第一家實(shí)現(xiàn)產(chǎn)品量產(chǎn)落地的公司。憑借先發(fā)的優(yōu)勢(shì),以及AI大模型帶來的指數(shù)級(jí)增長(zhǎng)的算力需求,相信天數(shù)智芯在國(guó)產(chǎn)通用GPU上已經(jīng)滾起來的雪球?qū)?huì)越滾越大。
-
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135503 -
天數(shù)智芯
+關(guān)注
關(guān)注
0文章
102瀏覽量
6621
發(fā)布評(píng)論請(qǐng)先 登錄
長(zhǎng)晶科技董事長(zhǎng)楊國(guó)江發(fā)表2026年新春賀詞
天數(shù)智芯重磅公布四代架構(gòu)路線圖,對(duì)標(biāo)英偉達(dá)
達(dá)實(shí)智能董事長(zhǎng)劉磅主持2026年度首次管理層會(huì)議
又一國(guó)產(chǎn)GPU企業(yè)上市
孟晚舟卸任華為終端公司董事 余承東任華為終端公司董事長(zhǎng)
AI教父Hinton對(duì)話云天勵(lì)飛陳寧
Imagination中國(guó)區(qū)董事長(zhǎng)兼亞太區(qū)總裁白農(nóng):通用計(jì)算GPU驅(qū)動(dòng)端側(cè)AI發(fā)展
芯海科技董事長(zhǎng)盧國(guó)建:破解健康測(cè)量難題,芯海構(gòu)建芯片+AI診斷新方案
羅姆與獵芯網(wǎng)簽署正式代理銷售協(xié)議
協(xié)創(chuàng)數(shù)據(jù)董事長(zhǎng)耿康銘先生榮登 2025 福布斯中國(guó)最佳 CEO 榜單
思特威徐辰榮獲2025福布斯中國(guó)最佳CEO
寧德時(shí)代董事長(zhǎng)兼CEO曾毓群在重要會(huì)議上闡述全球零碳轉(zhuǎn)型愿景并呼吁深化合作
說說中興通訊的歷任董事長(zhǎng)
中興通訊40年來首位女董事長(zhǎng) 方榕出任中興通訊董事長(zhǎng)
中興通訊最新公告:方榕出任中興通訊董事長(zhǎng),徐子陽續(xù)任總裁
對(duì)話天數(shù)智芯董事長(zhǎng)兼CEO蓋魯江:國(guó)產(chǎn)通用GPU性能提升的四大抓手
評(píng)論