電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(張量處理器)“Ironwood”,該芯片預(yù)計(jì)在未來幾周內(nèi)正式上市。
“Ironwood”由谷歌自主精心設(shè)計(jì),能夠輕松處理從大型模型訓(xùn)練到實(shí)時(shí)聊天機(jī)器人運(yùn)行以及AI智能體操作等各類復(fù)雜任務(wù)。
谷歌在新聞稿中著重強(qiáng)調(diào),“Ironwood”是專為應(yīng)對(duì)最嚴(yán)苛的工作負(fù)載而打造的。無論是大規(guī)模模型訓(xùn)練、復(fù)雜的強(qiáng)化學(xué)習(xí)(RL),還是高容量、低延遲的AI推理和模型服務(wù),它都能游刃有余。與TPU v5p相比,“Ironwood”的峰值性能大幅提升,達(dá)到10倍之多;和TPU v6e(Trillium)相比,其單芯片在訓(xùn)練和推理工作負(fù)載下的性能均提升4倍以上,成為谷歌迄今為止性能最強(qiáng)大、能效最高的定制芯片。
不僅如此,新一代“Ironwood” TPU在集群連接能力上也有著驚人表現(xiàn)。它可在單個(gè)集群中連接多達(dá)9216顆芯片,有效消除“最復(fù)雜模型中的數(shù)據(jù)瓶頸”,讓客戶能夠毫無壓力地運(yùn)行并擴(kuò)展當(dāng)前世界上最大、數(shù)據(jù)量最密集的模型。
張量處理單元(TPU)是谷歌公司專為加速機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的專用集成電路芯片(ASIC)。其研發(fā)項(xiàng)目始于2013年,旨在解決數(shù)據(jù)中心機(jī)器學(xué)習(xí)工作負(fù)載的加速需求。2016年5月,在Google I/O開發(fā)者大會(huì)上,TPU首次公開亮相,并應(yīng)用于AlphaGo人工智能圍棋系統(tǒng),這一事件標(biāo)志著TPU正式進(jìn)入大眾視野。
TPU的名稱源于谷歌TensorFlow開源深度學(xué)習(xí)框架,它采用脈動(dòng)陣列架構(gòu)和低精度計(jì)算技術(shù),在矩陣運(yùn)算任務(wù)中展現(xiàn)出卓越性能,推理速度比傳統(tǒng)GPU和CPU高15至30倍,能效比提升30至80倍。
2024年5月,谷歌發(fā)布了第六代TPU(Trillium)。這款芯片采用3D堆疊封裝技術(shù)和液冷系統(tǒng),在性能和能效方面都有顯著提升。其峰值計(jì)算性能較TPUv5e提升4.7倍,能效比比TPUv5e高67%,內(nèi)存容量增至32GB,芯片互聯(lián)速度達(dá)3200 Gbps,支持256芯片集群部署,單個(gè)Pod算力達(dá)925.9 teraflops,并于2024年12月通過Google Cloud向客戶提供商用服務(wù)。
此外,谷歌還宣布啟動(dòng)Project Suncatcher計(jì)劃,將Trillium TPU部署于衛(wèi)星群構(gòu)建太空機(jī)器學(xué)習(xí)計(jì)算系統(tǒng),計(jì)劃2027年發(fā)射原型衛(wèi)星,并計(jì)劃2026年部署并提供超過1吉瓦算力。
谷歌在TPU領(lǐng)域的發(fā)展不僅體現(xiàn)在技術(shù)迭代上,還收獲了重要訂單。當(dāng)?shù)貢r(shí)間10月23日,AI初創(chuàng)公司Anthropic宣布與谷歌達(dá)成合作,將部署多達(dá)100萬個(gè)谷歌的TPU芯片,用于訓(xùn)練旗下AI大模型Claude。此次擴(kuò)展計(jì)劃價(jià)值數(shù)百億美元,預(yù)計(jì)算力容量將于2026年達(dá)到1GW(千兆瓦)級(jí)別。
對(duì)于此次合作,谷歌云首席執(zhí)行官Thomas Kurian表示,Anthropic選擇大幅擴(kuò)展TPU的使用,是對(duì)TPU性價(jià)比和效率多年認(rèn)可的體現(xiàn)。Anthropic的首席財(cái)務(wù)官Krishna Rao也表示,此次合作不僅加強(qiáng)了谷歌與Anthropic的伙伴關(guān)系,也證明了自研芯片TPU的泛用性。
自2018年起,谷歌開始通過谷歌云出售TPU算力,目前公開大客戶包括Salesforce、Safe Superintelligence、Midjourney和Anthropic等。
盡管谷歌TPU發(fā)展勢頭迅猛,但在當(dāng)前AI芯片領(lǐng)域,英偉達(dá)的GPU依然占據(jù)主導(dǎo)地位。谷歌計(jì)算和人工智能基礎(chǔ)設(shè)施副總裁兼總經(jīng)理Mark Lohmeyer曾透露,TPU研發(fā)初衷是為了緩解算力壓力,減少對(duì)外部芯片的采購量。研究機(jī)構(gòu)Gartner的分析師Gaurav Gupta也指出,盡管谷歌擁有自研芯片,但由于需要為客戶保持靈活性,其仍是英偉達(dá)最大的客戶之一。和TPU相比,GPU能夠處理更廣泛的工作負(fù)載,可以更好地適應(yīng)客戶算法或模型的變化。
“Ironwood”由谷歌自主精心設(shè)計(jì),能夠輕松處理從大型模型訓(xùn)練到實(shí)時(shí)聊天機(jī)器人運(yùn)行以及AI智能體操作等各類復(fù)雜任務(wù)。
谷歌在新聞稿中著重強(qiáng)調(diào),“Ironwood”是專為應(yīng)對(duì)最嚴(yán)苛的工作負(fù)載而打造的。無論是大規(guī)模模型訓(xùn)練、復(fù)雜的強(qiáng)化學(xué)習(xí)(RL),還是高容量、低延遲的AI推理和模型服務(wù),它都能游刃有余。與TPU v5p相比,“Ironwood”的峰值性能大幅提升,達(dá)到10倍之多;和TPU v6e(Trillium)相比,其單芯片在訓(xùn)練和推理工作負(fù)載下的性能均提升4倍以上,成為谷歌迄今為止性能最強(qiáng)大、能效最高的定制芯片。
不僅如此,新一代“Ironwood” TPU在集群連接能力上也有著驚人表現(xiàn)。它可在單個(gè)集群中連接多達(dá)9216顆芯片,有效消除“最復(fù)雜模型中的數(shù)據(jù)瓶頸”,讓客戶能夠毫無壓力地運(yùn)行并擴(kuò)展當(dāng)前世界上最大、數(shù)據(jù)量最密集的模型。

圖:包含9,216顆Ironwood的TPU集群(來源:谷歌云)
張量處理單元(TPU)是谷歌公司專為加速機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的專用集成電路芯片(ASIC)。其研發(fā)項(xiàng)目始于2013年,旨在解決數(shù)據(jù)中心機(jī)器學(xué)習(xí)工作負(fù)載的加速需求。2016年5月,在Google I/O開發(fā)者大會(huì)上,TPU首次公開亮相,并應(yīng)用于AlphaGo人工智能圍棋系統(tǒng),這一事件標(biāo)志著TPU正式進(jìn)入大眾視野。
TPU的名稱源于谷歌TensorFlow開源深度學(xué)習(xí)框架,它采用脈動(dòng)陣列架構(gòu)和低精度計(jì)算技術(shù),在矩陣運(yùn)算任務(wù)中展現(xiàn)出卓越性能,推理速度比傳統(tǒng)GPU和CPU高15至30倍,能效比提升30至80倍。
2024年5月,谷歌發(fā)布了第六代TPU(Trillium)。這款芯片采用3D堆疊封裝技術(shù)和液冷系統(tǒng),在性能和能效方面都有顯著提升。其峰值計(jì)算性能較TPUv5e提升4.7倍,能效比比TPUv5e高67%,內(nèi)存容量增至32GB,芯片互聯(lián)速度達(dá)3200 Gbps,支持256芯片集群部署,單個(gè)Pod算力達(dá)925.9 teraflops,并于2024年12月通過Google Cloud向客戶提供商用服務(wù)。
此外,谷歌還宣布啟動(dòng)Project Suncatcher計(jì)劃,將Trillium TPU部署于衛(wèi)星群構(gòu)建太空機(jī)器學(xué)習(xí)計(jì)算系統(tǒng),計(jì)劃2027年發(fā)射原型衛(wèi)星,并計(jì)劃2026年部署并提供超過1吉瓦算力。
谷歌在TPU領(lǐng)域的發(fā)展不僅體現(xiàn)在技術(shù)迭代上,還收獲了重要訂單。當(dāng)?shù)貢r(shí)間10月23日,AI初創(chuàng)公司Anthropic宣布與谷歌達(dá)成合作,將部署多達(dá)100萬個(gè)谷歌的TPU芯片,用于訓(xùn)練旗下AI大模型Claude。此次擴(kuò)展計(jì)劃價(jià)值數(shù)百億美元,預(yù)計(jì)算力容量將于2026年達(dá)到1GW(千兆瓦)級(jí)別。
對(duì)于此次合作,谷歌云首席執(zhí)行官Thomas Kurian表示,Anthropic選擇大幅擴(kuò)展TPU的使用,是對(duì)TPU性價(jià)比和效率多年認(rèn)可的體現(xiàn)。Anthropic的首席財(cái)務(wù)官Krishna Rao也表示,此次合作不僅加強(qiáng)了谷歌與Anthropic的伙伴關(guān)系,也證明了自研芯片TPU的泛用性。
自2018年起,谷歌開始通過谷歌云出售TPU算力,目前公開大客戶包括Salesforce、Safe Superintelligence、Midjourney和Anthropic等。
盡管谷歌TPU發(fā)展勢頭迅猛,但在當(dāng)前AI芯片領(lǐng)域,英偉達(dá)的GPU依然占據(jù)主導(dǎo)地位。谷歌計(jì)算和人工智能基礎(chǔ)設(shè)施副總裁兼總經(jīng)理Mark Lohmeyer曾透露,TPU研發(fā)初衷是為了緩解算力壓力,減少對(duì)外部芯片的采購量。研究機(jī)構(gòu)Gartner的分析師Gaurav Gupta也指出,盡管谷歌擁有自研芯片,但由于需要為客戶保持靈活性,其仍是英偉達(dá)最大的客戶之一。和TPU相比,GPU能夠處理更廣泛的工作負(fù)載,可以更好地適應(yīng)客戶算法或模型的變化。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
TPU
+關(guān)注
關(guān)注
0文章
171瀏覽量
21684
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
熱點(diǎn)推薦
小米自研3nm旗艦SoC、4G基帶亮相!雷軍回顧11年造芯路
XRING O1旗艦芯片。除了大芯片之外,還有此前未有曝光的,搭載小米自研4G基帶的玄戒T1手表芯片,以及小米首款豪華高性能SUV小米YU7。下面我們來回顧一下
阿里自研AI芯片“真武”亮相 “通云哥”黃金三角浮出水面
”首次浮出水面。 阿里巴巴正在將“通云哥”打造成一臺(tái)AI超級(jí)計(jì)算機(jī),它同時(shí)擁有全棧自研芯片平頭哥、亞太第一的阿里云,以及全球最強(qiáng)的開源模型“
微軟發(fā)布AI芯片Maia 200,性能超越谷歌TPU和亞馬遜Trainium
電子發(fā)燒友網(wǎng)綜合報(bào)道 美東時(shí)間1月26日,微軟重磅發(fā)布第二代自研人工智能芯片Maia 200,這一舉措成為微軟減少對(duì)英偉達(dá)芯片依賴、高效驅(qū)動(dòng)自身服務(wù)的關(guān)鍵一步,也標(biāo)志著其在自
提前實(shí)測AT4V H00電流傳感器,抗諧波干擾性能比同類型產(chǎn)品提升30%!
電子2025升級(jí)款A(yù)T4VH00霍爾開環(huán)電流傳感器,專門針對(duì)工業(yè)場景核心痛點(diǎn)“抗諧波干擾”做了專項(xiàng)實(shí)測,結(jié)果直接超出預(yù)期:其抗諧波干擾性能比同價(jià)位主流產(chǎn)品提升30%
亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4倍
Trainium 4的開發(fā)計(jì)劃。亞馬遜表示,這款芯片能夠比英偉達(dá)市場領(lǐng)先的圖形處理單元(GPU)更便宜、更高效地驅(qū)動(dòng)AI模型背后的密集計(jì)算。 ? ? 作為亞馬遜首款3納米工藝AI芯片,Trainium3的核心突破在于性能、能效與
亞馬遜新一代自研服務(wù)器芯片Graviton5問世,性能提升25%
電子發(fā)燒友網(wǎng)綜合報(bào)道 近日,亞馬遜云科技宣布推出其迄今為止性能最強(qiáng)、能效最高的Amazon Graviton5處理器,為Amazon EC2上的廣泛工作負(fù)載提供最佳性價(jià)比。與上一代相比
英偉達(dá)遇最強(qiáng)對(duì)手,谷歌加速推廣自研TPU
行業(yè)芯事行業(yè)資訊
電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2025年11月26日 13:54:07
季豐電子自研PCB管理系統(tǒng)的簡單介紹
季豐電子自研的PCB管理系統(tǒng),整合報(bào)價(jià)+投板+Release三大核心模塊,覆蓋從設(shè)計(jì)發(fā)布、訂單對(duì)接到生產(chǎn)交付的全業(yè)務(wù)流程。
看點(diǎn):臺(tái)積電計(jì)劃發(fā)行235億元新臺(tái)幣債券 谷歌云發(fā)布最強(qiáng)自研TPU(張量處理器)
%,140億元新臺(tái)幣;7年期的利率1.53%,30億元新臺(tái)幣;10年期的利率1.58%,65億元新臺(tái)幣。 首個(gè)深海生境智能多模態(tài)大模型發(fā)布 11月6日,自然資源部在2025廈門國際海洋周開幕式上發(fā)布全球首個(gè)面向深海典型生境的多模態(tài)大模型“DePTH-GPT”。“DePTH
今日看點(diǎn):谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典超算快13000倍;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米
谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典超算快13000倍 近日,谷歌在《自然》雜志披露與Willow芯片相關(guān)的量子計(jì)算突破性研究成果。該公司稱這是歷史上首次證明量子計(jì)算機(jī)可以在硬件上成功運(yùn)行一項(xiàng)可
發(fā)表于 10-23 10:20
?1632次閱讀
亞馬遜云科技在中國區(qū)域推出Amazon Graviton4實(shí)例 以自研芯片驅(qū)動(dòng)企業(yè)算力升級(jí)
北京2025年9月10日 /美通社/ -- 亞馬遜云科技宣布,通過與光環(huán)新網(wǎng)和西云數(shù)據(jù)的緊密合作,在亞馬遜云科技(北京)區(qū)域和亞馬遜云科技(寧夏)區(qū)域推出基于新一代
國產(chǎn)真自研高性能圖形 GPU 重磅發(fā)布:跑分超 RTX4060,暢玩《黑神話?悟空》
系列。 ? 礪算科技創(chuàng)始人、CEO 宣以方表示,礪算 7G100 系列 GPU 從計(jì)算核心到指令集完全由自主設(shè)計(jì),基于自研 “天圖” 架構(gòu),并配備自研指令集、
發(fā)表于 07-26 21:45
?6180次閱讀
高端芯片自研,服務(wù)器芯片傳來好消息!
電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)當(dāng)前,自研處理器已經(jīng)跨過了能用的階段,逐漸走向好用,但無論是消費(fèi)級(jí)還是服務(wù)器級(jí)都面臨著如何在性能上接近國外高端產(chǎn)品,以及生態(tài)上如何更加完善的問題。國內(nèi)廠商對(duì)于服務(wù)器芯片
谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命
谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設(shè)計(jì)。這款功能強(qiáng)大的 AI
谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?
電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google
谷歌云發(fā)布最強(qiáng)自研TPU,性能比前代提升4倍
評(píng)論