国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌全新AI架構,單芯片每秒1000萬億次運算

獨愛72H ? 來源:機器之心Pro ? 作者:機器之心Pro ? 2019-11-18 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:機器之心Pro)

2016 年底,谷歌 TPU 團隊的十位核心開發者中的八位悄悄離職,創辦了一家名為 Groq 的機器學習系統公司。在此后的三年里,這家公司一直很低調。但最近,他們帶著一款名為 TSP 的芯片架構出現在公眾視野里。

TSP 的全稱是 Tensor Streaming Processor,專為機器學習等 AI 相關需求打造。該架構在單塊芯片上可以實現每秒 1000 萬億(10 的 15 次方)次運算,是全球首個實現該級別性能的架構,其浮點運算性能可達每秒 250 萬億次(TFLOPS)。在摩爾定律走向消亡的背景下,這一架構的問世標志著芯片之爭從晶體管轉向架構。

250 TFLOPS 浮點運算性能是什么概念?目前的世界第一超級計算機 Summit,其峰值算力為 200,794.9 TFLOPS,它的背后是 28,000 塊英偉達 Volta GPU。如果 TSP 達到了類似的效率,僅需 803 塊就可以實現同樣的性能。Groq 在一份白皮書中介紹了這項全新的架構設計。此外,他們還將在于美國丹佛舉辦的第 23 屆國際超算高峰論壇上展示這一成果。

我們為這一行業和我們的客戶感到興奮,Groq 的聯合創始人和 CEO Jonathan Ross 表示。頂級 GPU 公司都在宣稱他們有望在未來幾年向用戶交付一款每秒百萬億次運算性能的產品,但 Groq 現在就做到了,而且建立了一個新的性能標準。就低延遲和推理速度而言,Groq 的架構比其他任何用于推理的架構都要快許多倍。我們與用戶的互動證明了這一點。

Groq 的 TSP 架構是專為計算機視覺、機器學習和其他 AI 相關工作負載的性能要求設計的。對于一大批需要深度學習推理運算的應用來說,Groq 的解決方案是非常理想的選擇,Groq 的首席架構師 Dennis Abts 表示,但除此之外,Groq 的架構還能用于廣泛的工作負載。它的性能和簡潔性使其成為所有高性能即數據和計算密集型工作復雜的理想平臺。

Groq 的這款架構受到軟件優先(software first)理念的啟發。它在 Groq 開發的 TSP 中實現,為實現計算靈活性和大規模并行計算提供了一種新的范式,但沒有傳統 GPU 和 CPU 架構的限制和溝通開銷。在 Groq 的架構中,Groq 編譯器負責編碼所有內容:數據流入芯片,并在正確的時間和正確的地點插入,以確保計算實時進行,沒有停頓。執行規劃由軟件負責,這樣就可以釋放出原本要用于動態指令執行的寶貴硬件資源。

在傳統的體系架構中,將數據從 DRAM 移動到處理器需要大量的算力和時間,而且相同工作負載上的處理性能也是可變的。在典型的工作流中,開發人員通過反復運行工作負載或程序來對其進行配置和測試,以驗證和度量其平均處理性能。由于處理器接收和發送數據的方式不同,這種處理可能會得到略有差別的結果,而開發人員的工作就是手動調整程序以達到預定的可靠性級別。

但有了 Groq 的硬件和軟件,編譯器就可以準確地知道芯片的工作方式以及執行每個計算所需的時間。編譯器在正確的時間將數據和指令移動到正確的位置,這樣就不會有延遲。到達硬件的指令流是完全編排好的,使得處理速度更快,而且可預測。

為了滿足深度學習等計算密集型任務的需求,芯片的設計似乎正在變得越來越復雜。但 Groq 認為,這種趨勢從根本上就是錯誤的。他們在白皮書中指出,當前處理器架構的復雜性已經成為阻礙開發者生產和 AI 應用部署的主要障礙。當前處理器的復雜性降低了開發者工作效率,再加上摩爾定律逐漸變慢,實現更高的計算性能變得越來越困難。

Groq 的芯片設計降低了傳統硬件開發的復雜度,因此開發者可以更加專注于算法(或解決其他問題),而不是為了硬件調整自己的解決方案。有了這種更加簡單的硬件設計,開發者無需進行剖析研究(profiling),因此可以節省資源,更容易大規模部署 AI 應用。與基于 CPU、GPU 和 FPGA 的傳統復雜架構相比,Groq 的芯片還簡化了認證和部署,使客戶能夠簡單而快速地實現可擴展、單瓦高性能的系統。

Groq 的張量流架構可以在任何需要的地方提供算力。與當前領先的 GPU、CPU 相比,Groq 處理器的每個晶體管可以實現 3-6 倍的性能提升。這一改進意味著交付性能的提升、延遲的下降以及成本的降低。結果是,Groq 的架構使用起來更加簡單,而且性能高于傳統計算平臺。

(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54010

    瀏覽量

    466123
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111407
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    馬斯克:AI5芯片設計進展順利,特斯拉AI戰略邁入新階段

    5芯片將是一款“性能非常強大”的產品,顆SoC性能可媲美英偉達Hopper級別,雙芯配置則接近Blackwell級別,但成本與功耗顯著更低。根據技術參數,AI5芯片的算力密度達
    的頭像 發表于 01-19 14:05 ?1892次閱讀

    AI半導體萬億浪潮中,2016系列10~60MHz溫補晶振撐起系統節奏

    AI?擴建推動半導體進入千萬億周期:AMD說這是?1?萬億美元的機會;英偉達說未來五年是?3–4?萬億美元;博通預測定制硅將沖向?1000?
    的頭像 發表于 12-12 16:50 ?1206次閱讀
    <b class='flag-5'>AI</b>半導體<b class='flag-5'>萬億</b>浪潮中,2016系列10~60MHz溫補晶振撐起系統節奏

    看點:全球首顆!中國研發全新架構閃存芯片 OpenAI拉上巨頭豪賭AI基建

    給大家帶來一些業界消息: 全球首顆!中國研發全新架構閃存芯片 日前,復旦大學團隊在《自然》發表成果,成功研制全球首顆二維—硅基混合架構閃存芯片
    的頭像 發表于 10-10 18:20 ?1848次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    建立的基礎: ①算力支柱②數據支柱③計算支柱 1)算力 與AI算力有關的因素: ①晶體管數量②晶體管速度③芯片架構芯片面積⑤制造工藝⑥芯片
    發表于 09-18 15:31

    適應邊緣AI全新時代的GPU架構

    電子發燒友網站提供《適應邊緣AI全新時代的GPU架構.pdf》資料免費下載
    發表于 09-15 16:42 ?47次下載

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構

    、Transformer 模型的后繼者 二、用創新方法實現深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優勢如下: ①模
    發表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    ②Transformer引擎③NVLink Switch系統④機密計算⑤HBM FPGA: 架構的主要特點:可重構邏輯和路由,可以快速實現各種不同形式的神經網絡加速。 ASIC: 介紹了幾種ASIC AI芯片
    發表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰。第二章和第三章分別介紹實現深度學習AI芯片的創新方法和架構。以及一些新型的算法
    發表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    依曼架構下數據搬運瓶頸問題,降低功耗,提升運算效率,這種創新性成果在職稱評審中會備受青睞。 用項目經驗為職稱申報添彩 實際項目經驗是職稱評審中最有力的證明材料。在參與 AI 芯片研發項
    發表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    創新、應用創新、系統創新五個部分,接下來一一解讀。 算法創新 在深度學習AI芯片的創新上,書中圍繞大模型與Transformer算法的算力需求,提出了一系列架構與方法創新,包括存內計算技術、基于開源
    發表于 07-28 13:54

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    套件2.0,打造了一整套圍繞AI開發效率與落地路徑展開的“系統性解法”,為開發者提供了AI應用開發工具全家桶。同時,全新升級的旗艦5G智能體AI芯片
    發表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大規模思考與推理的 AI 模型新引擎?

    電子發燒友網報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據悉,該芯片預計于今年晚些時候面向 Go
    的頭像 發表于 04-12 00:57 ?3725次閱讀

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓練、AI推理和AI成本等需求
    的頭像 發表于 03-31 11:27 ?1342次閱讀

    寶馬發布全新一代智能電子電氣架構

    "超級大腦"賦能寶馬新世代車型智能駕駛樂趣 全新一代電子電氣架構搭載新世代車型,覆蓋全動力系統和全細分車型 全新一代電子電氣架構集成算力提升20倍,支持
    的頭像 發表于 03-13 15:42 ?739次閱讀

    驅動 AI 邊緣計算新時代!高性能 i.MX 95 應用平臺引領未來

    TOPS (每秒萬億運算) 的運算能力。這使得推理計算的時間大幅縮短,例如,在運行常見的物體檢測模型 YOLOv5 時,處理單張圖片僅需
    的頭像 發表于 03-11 08:59 ?846次閱讀
    驅動 <b class='flag-5'>AI</b> 邊緣計算新時代!高性能 i.MX 95 應用平臺引領未來