国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

欲把AI計算成本打下來,谷歌高效益TPU正式開放

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2023-11-14 00:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/周凱揚)對于每個想要自己開發和部署AI模型的應用開發者來說,硬件和服務器支出都是一筆不小的費用。就以英偉達GPU為例,即便是消費級的GPU,最近也迎來了一波漲價潮,更不用爆火的A100/H100等型號了。

即便是租賃服務器,基于這些熱門硬件的服務器也遠算不上便宜,因此不少云服務廠商為了進一步拉攏更多AI應用開發者,紛紛推出了性價比更高的選項。這些選項有的是基于CPU的AI計算服務器,有的是基于第三方AI加速器打造的服務器,還有的則是由云服務廠商基于自研加速器打造且獨家提供的服務器。

谷歌高性價比TPU面世

谷歌在今年8月底發布了第五代的自研TPU,TPU v5e。谷歌稱該加速器實現了性能與成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下兩倍的訓練性能,以及針對LLM和生成式AI模型2.5倍的推理性能。

wKgaomVR-HqAJvSzAABXKc7C2hk445.png
TPU v5e架構


單個TPU v5e Pod由256個芯片互聯,總帶寬超過400Tb/s,INT8總算力達100petaOps。而且谷歌為TPU v5e采用了更靈活的配置選項,其支持8個不同的虛擬機配置,單個切片支持單芯片到250多個芯片,如此一來客戶就可以根據自己的模型大小來選擇合適的配置。

而且過去借助谷歌TPU進行的訓練負載只局限于單個切片中,谷歌為此開發了Multislice技術,可通過芯片間互聯以及數據中心網絡中的多個TPU Pod相連,從而將訓練工作擴展到數萬個芯片上。

為了進一步擴大對開發生態的支持,TPU v5e還內置了對JAX、Pytorch和Tensorflow等領先AI框架,以及 Hugging Face 的 TransformersAccelerate、PyTorch Lightning 和 Ray等一系列常用開源工具的支持。

開放使用與自用

近日,谷歌終于宣布TPU v5e進入公用階段,且在最新的MLPerf訓練3.1測試中,TPUv5e獲得了更好的表現。在該測試中,谷歌改進了創新的混合精度訓練算法,除了原生支持的BF16外,還用到了INT8精度格式。這意味著客戶在提高了模型準確性的同時,將花費更少的成本。

wKgZomVR-IOANSMPAAIyMIzn61I221.png
從谷歌云對于TPU v5e的定價表來看,v5e在成本效益上確實有著極大的優勢。不過需要注意的是,v5e與v2、v3 Pod類似,每個芯片中只有一個TensorCore,而v4 Pod的每個芯片中有兩個TensorCore。這也是為何v5e的單芯片峰值算力為197TFLOPS,而v4的單芯片峰值算力為275TFLOPS,可即便如此,在按芯片小時的定價下,其所需成本依然低于v4。

在如此高的性價比下,谷歌不僅將TPU提供給外部開發者使用,其內部一些開發項目也開始用上TPU v5e。比如其PaLM模型的創建,就用到了上文提到的Multislice技術,谷歌的Bard團隊同樣在用TPU v5e訓練這一生成式AI聊天機器人

寫在最后

其實在TPUv5e開放使用之前,谷歌也正式開放了A3 VM這類GPU加速虛擬機的使用。這也是多數云服務廠商采用的多方案供應策略,其自研加速器只需要為客戶提供一個高性價比的方案,而追求更高性能的客戶,依然可以選擇基于H100 GPU打造的服務器。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301422
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    直擊英偉達腹地?谷歌TPU v7開放部署,催生OCS產業鏈紅利

    Processing Unit, TPU)構建了一套完整的AI算力基礎設施體系。 ? 11月,谷歌宣布第七代 TPU v7(代號 Ironwood)將在后續幾周大規模上市。與此消息同
    的頭像 發表于 11-27 08:53 ?9357次閱讀
    直擊英偉達腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7<b class='flag-5'>開放</b>部署,催生OCS產業鏈紅利

    什么是TPU?萬協通帶你看懂AI算力的“變形金剛”

    ”——TPU(Tensor Processing Unit)。 今天,作為國產可重構TPU芯片的先行者,萬協通將帶你剝開晦澀的技術外殼,看懂這塊決定AI未來的核心硬件,以及中國芯片如何換道超車,上演一場精彩的“變形記”。
    的頭像 發表于 01-13 13:22 ?261次閱讀
    什么是<b class='flag-5'>TPU</b>?萬協通帶你看懂<b class='flag-5'>AI</b>算力的“變形金剛”

    AI芯片大單!Anthropic從博通采購100萬顆TPU v7p芯片

    Anthropic供應基于TPU v7p的機架級 AI 系統,繞過TPU芯片的另一開發參與方谷歌。不過谷歌預計仍可從 Anthropic
    的頭像 發表于 01-06 08:38 ?6170次閱讀

    2025年中科曙光聯合多家企業共同推出AI計算開放架構

    2025年,人工智能產業步入規模化應用深水區,大模型技術迭代加速,對算力規模與效率提出更高要求。在這一背景下,9月,中科曙光依托國家先進計算產業創新中心,聯合產業鏈上下游20多家企業共同推出AI計算
    的頭像 發表于 12-30 15:43 ?543次閱讀

    谷歌云發布最強自研TPU,性能比前代提升4倍

    電子發燒友網報道(文/李彎彎)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(張量處理器)“Ironwood”,該芯片預計在未來幾周內正式上市。 ? “Ironwood”由谷歌自主
    的頭像 發表于 11-13 07:49 ?8620次閱讀
    <b class='flag-5'>谷歌</b>云發布最強自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    計算成本。 核心: MoE模型利用稀疏性驅動結構,通過包含多個專家網絡的稀疏MoE層替換密集層,其中每個專家致力于特定的訓練數據或任務的子集,并且一個可訓練的門控機制動態地將輸入標記分配給這些專家,從而
    發表于 09-18 15:31

    電動機噪聲、振動和聲振粗糙度開發:使用低計算成本的系統級模型預測早期噪聲、振動和聲振粗糙度

    優勢使用計算成本低的系統級模型在動態運行條件下對電驅動裝置執行早期噪聲、振動和聲振粗糙度評估優化電機控制策略并做出更好的設計選擇,以提高電動汽車的噪聲、振動和聲振粗糙度使用Simcenter節省時間
    的頭像 發表于 08-13 11:46 ?713次閱讀
    電動機噪聲、振動和聲振粗糙度開發:使用低<b class='flag-5'>計算成本</b>的系統級模型預測早期噪聲、振動和聲振粗糙度

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發展離不開高性能計算硬件的支持,而傳統CPU由于架構限制,難以高效處理AI任務中的大規模并行計算需求。因此,專為
    的頭像 發表于 07-09 15:59 ?1584次閱讀

    AlphaEvolve有望革新AI玩具芯片設計,算法進化驅動能效與成本雙突破

    電子發燒友網綜合報道,近期,谷歌?DeepMind發布了一款AlphaEvolve,是一款通用科學AI代理,基于大語言模型Gemini系列與進化計算框架,專注于算法發現與優化。可以支持數百行代碼
    的頭像 發表于 06-18 00:09 ?3768次閱讀

    智算加速卡是什么東西?它真能在AI戰場上干掉GPU和TPU

    隨著AI技術火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環節,算力才是硬通貨。你有沒有發現,現在越來越多的AI企業不光用GPU,也不怎么迷信
    的頭像 發表于 06-05 13:39 ?1648次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰場上干掉GPU和<b class='flag-5'>TPU</b>!

    Deepseek海思SD3403邊緣計算AI產品系統

    海思SD3403邊緣計算AI框架,提供了一套開放AI訓練產品工具包,解決客戶低成本AI系統,針
    發表于 04-28 11:05

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學習應用設計的硬件加速器。它的開發源于對人工智能(AI)和機器學習應用的需求,尤其是深度學習中的神經網絡計算
    的頭像 發表于 04-22 09:41 ?4368次閱讀
    <b class='flag-5'>TPU</b>處理器的特性和工作原理

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設計。這款功能強大的
    的頭像 發表于 04-12 11:10 ?3736次閱讀
    <b class='flag-5'>谷歌</b>第七代<b class='flag-5'>TPU</b> Ironwood深度解讀:<b class='flag-5'>AI</b>推理時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規模思考與推理的 AI 模型新引擎?

    Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。 ? 在核心亮點層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設計的 TPU 芯片,
    的頭像 發表于 04-12 00:57 ?3724次閱讀

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    和 Renesas一直致力于推動開源生態的發展,并積極合作打造高效開放計算平臺。BPI-AI2N & BPI-AI2N Car
    發表于 03-19 17:54