国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌采用全新AI架構,晶體管性能得到巨幅提升

獨愛72H ? 來源:機器之心Pro ? 作者:機器之心Pro ? 2019-11-20 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:機器之心Pro)

TSP 的全稱是 Tensor Streaming Processor,專為機器學習AI 相關需求打造。該架構在單塊芯片上可以實現(xiàn)每秒 1000 萬億(10 的 15 次方)次運算,是全球首個實現(xiàn)該級別性能的架構,其浮點運算性能可達每秒 250 萬億次(TFLOPS)。在摩爾定律走向消亡的背景下,這一架構的問世標志著芯片之爭從晶體管轉向架構。

250 TFLOPS 浮點運算性能是什么概念?目前的世界第一超級計算機 Summit,其峰值算力為 200,794.9 TFLOPS,它的背后是 28,000 塊英偉達 Volta GPU。如果 TSP 達到了類似的效率,僅需 803 塊就可以實現(xiàn)同樣的性能。Groq 在一份白皮書中介紹了這項全新的架構設計。此外,他們還將在于美國丹佛舉辦的第 23 屆國際超算高峰論壇上展示這一成果。

我們?yōu)檫@一行業(yè)和我們的客戶感到興奮,Groq 的聯(lián)合創(chuàng)始人和 CEO Jonathan Ross 表示。頂級 GPU 公司都在宣稱他們有望在未來幾年向用戶交付一款每秒百萬億次運算性能的產品,但 Groq 現(xiàn)在就做到了,而且建立了一個新的性能標準。就低延遲和推理速度而言,Groq 的架構比其他任何用于推理的架構都要快許多倍。我們與用戶的互動證明了這一點。

Groq 的 TSP 架構是專為計算機視覺、機器學習和其他 AI 相關工作負載的性能要求設計的。對于一大批需要深度學習推理運算的應用來說,Groq 的解決方案是非常理想的選擇,Groq 的首席架構師 Dennis Abts 表示,但除此之外,Groq 的架構還能用于廣泛的工作負載。它的性能和簡潔性使其成為所有高性能即數據和計算密集型工作復雜的理想平臺。

Groq 的這款架構受到軟件優(yōu)先(software first)理念的啟發(fā)。它在 Groq 開發(fā)的 TSP 中實現(xiàn),為實現(xiàn)計算靈活性和大規(guī)模并行計算提供了一種新的范式,但沒有傳統(tǒng) GPU 和 CPU 架構的限制和溝通開銷。在 Groq 的架構中,Groq 編譯器負責編碼所有內容:數據流入芯片,并在正確的時間和正確的地點插入,以確保計算實時進行,沒有停頓。執(zhí)行規(guī)劃由軟件負責,這樣就可以釋放出原本要用于動態(tài)指令執(zhí)行的寶貴硬件資源。

在傳統(tǒng)的體系架構中,將數據從 DRAM 移動到處理器需要大量的算力和時間,而且相同工作負載上的處理性能也是可變的。在典型的工作流中,開發(fā)人員通過反復運行工作負載或程序來對其進行配置和測試,以驗證和度量其平均處理性能。由于處理器接收和發(fā)送數據的方式不同,這種處理可能會得到略有差別的結果,而開發(fā)人員的工作就是手動調整程序以達到預定的可靠性級別。

但有了 Groq 的硬件和軟件,編譯器就可以準確地知道芯片的工作方式以及執(zhí)行每個計算所需的時間。編譯器在正確的時間將數據和指令移動到正確的位置,這樣就不會有延遲。到達硬件的指令流是完全編排好的,使得處理速度更快,而且可預測。開發(fā)人員可以在 Groq 芯片上運行相同的模型 100 次,每次得到的結果都完全相同。對于安全和準確性要求都非常高的應用來說(如自動駕駛汽車),這種計算上的準確性至關重要。

另外,使用 Groq 硬件設計的系統(tǒng)不會受到長尾延遲的影響,AI 系統(tǒng)可以在特定的功率或延遲預算內進行調整。這種軟件優(yōu)先的設計(即編譯器決定硬件架構)理念幫助 Groq 設計出了一款簡單、高性能的架構,可以加速推理流程。該架構既支持傳統(tǒng)的機器學習模型,也支持新的計算學習模型,目前在 x86 和非 x86 系統(tǒng)的客戶站點上運行。

為了滿足深度學習等計算密集型任務的需求,芯片的設計似乎正在變得越來越復雜。但 Groq 認為,這種趨勢從根本上就是錯誤的。他們在白皮書中指出,當前處理器架構的復雜性已經成為阻礙開發(fā)者生產和 AI 應用部署的主要障礙。當前處理器的復雜性降低了開發(fā)者工作效率,再加上摩爾定律逐漸變慢,實現(xiàn)更高的計算性能變得越來越困難。

Groq 的芯片設計降低了傳統(tǒng)硬件開發(fā)的復雜度,因此開發(fā)者可以更加專注于算法(或解決其他問題),而不是為了硬件調整自己的解決方案。有了這種更加簡單的硬件設計,開發(fā)者無需進行剖析研究(profiling),因此可以節(jié)省資源,更容易大規(guī)模部署 AI 應用。與基于 CPU、GPU 和 FPGA 的傳統(tǒng)復雜架構相比,Groq 的芯片還簡化了認證和部署,使客戶能夠簡單而快速地實現(xiàn)可擴展、單瓦高性能的系統(tǒng)。

Groq 的張量流架構可以在任何需要的地方提供算力。與當前領先的 GPU、CPU 相比,Groq 處理器的每個晶體管可以實現(xiàn) 3-6 倍的性能提升。這一改進意味著交付性能的提升、延遲的下降以及成本的降低。結果是,Groq 的架構使用起來更加簡單,而且性能高于傳統(tǒng)計算平臺。
(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111411
  • AI芯片
    +關注

    關注

    17

    文章

    2128

    瀏覽量

    36785
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    CGH40006P射頻晶體管

    CGH40006P射頻晶體管CGH40006P是Wolfspeed(原CREE)推出的一款 6W 射頻功率氮化鎵高電子遷移率晶體管(GaN HEMT),采用 28V 電源軌設計,具備 DC 至
    發(fā)表于 02-03 10:00

    探索BFU520Y:雙NPN寬帶硅射頻晶體管的卓越性能

    探索BFU520Y:雙NPN寬帶硅射頻晶體管的卓越性能 在射頻晶體管的領域中,NXP的BFU520Y脫穎而出,成為高速、低噪聲應用的理想之選。今天,我們就來深入剖析這款雙NPN寬帶硅射頻晶體管
    的頭像 發(fā)表于 12-30 17:35 ?1156次閱讀

    晶體管入門:BJT 與 MOSFET 的控制差異#晶體管 #BJT #MOSFET? #場效應 #電子放大

    晶體管
    安泰小課堂
    發(fā)布于 :2025年12月05日 17:20:57

    基于偏置電阻晶體管(BRT)的數字晶體管系列MUN2231等產品解析

    在電子電路設計中,晶體管的合理選擇和應用對于電路性能起著關鍵作用。今天,我們就來深入探討ON Semiconductor推出的MUN2231、MMUN2231L、MUN5231、DTC123EE、DTC123EM3、NSBC123EF3這一系列數字
    的頭像 發(fā)表于 12-02 15:46 ?443次閱讀
    基于偏置電阻<b class='flag-5'>晶體管</b>(BRT)的數字<b class='flag-5'>晶體管</b>系列MUN2231等產品解析

    電壓選擇晶體管應用電路第二期

    電壓選擇晶體管應用電路第二期 以前發(fā)表過關于電壓選擇晶體管的結構和原理的文章,這一期我將介紹一下電壓選擇晶體管的用法。如圖所示: 當輸入電壓Vin等于電壓選擇晶體管QS的柵極控制電壓時
    發(fā)表于 11-17 07:42

    多值電場型電壓選擇晶體管結構

    多值電場型電壓選擇晶體管結構 為滿足多進制邏輯運算的需要,設計了一款多值電場型電壓選擇晶體管。控制二進制電路通斷需要二進制邏輯門電路,實際上是對電壓的一種選擇,而傳統(tǒng)二進制邏輯門電路通常比較復雜
    發(fā)表于 09-15 15:31

    Nexperia推出采用銅夾片封裝的雙極性晶體管

    的新產品旨在滿足工業(yè)與汽車領域對更高功率效率、更具成本優(yōu)勢設計方案的持續(xù)需求。與傳統(tǒng)DPAK封裝的MJD晶體管相比,采用CFP15B封裝的MJPE系列產品在保證性能不受影響的前提下,能顯著節(jié)省電路板空間并帶來成本優(yōu)勢。
    的頭像 發(fā)表于 07-18 14:19 ?2474次閱讀

    晶體管架構的演變過程

    芯片制程從微米級進入2納米時代,晶體管架構經歷了從 Planar FET 到 MBCFET的四次關鍵演變。這不僅僅是形狀的變化,更是一次次對物理極限的挑戰(zhàn)。從平面晶體管到MBCFET,每一次
    的頭像 發(fā)表于 07-08 16:28 ?2312次閱讀
    <b class='flag-5'>晶體管</b><b class='flag-5'>架構</b>的演變過程

    下一代高速芯片晶體管解制造問題解決了!

    提高了器件的性能。據IMEC的研究,叉片晶體管相比納米片晶體管可以實現(xiàn)約10%的性能提升。 叉片晶體管
    發(fā)表于 06-20 10:40

    鰭式場效應晶體管的原理和優(yōu)勢

    自半導體晶體管問世以來,集成電路技術便在摩爾定律的指引下迅猛發(fā)展。摩爾定律預言,單位面積上的晶體管數量每兩年翻一番,而這一進步在過去幾十年里得到了充分驗證。
    的頭像 發(fā)表于 06-03 18:24 ?1920次閱讀
    鰭式場效應<b class='flag-5'>晶體管</b>的原理和優(yōu)勢

    薄膜晶體管技術架構與主流工藝路線

    導語薄膜晶體管(TFT)作為平板顯示技術的核心驅動元件,通過材料創(chuàng)新與工藝優(yōu)化,實現(xiàn)了從傳統(tǒng)非晶硅向氧化物半導體、柔性電子的技術跨越。本文將聚焦于薄膜晶體管制造技術與前沿發(fā)展。
    的頭像 發(fā)表于 05-27 09:51 ?2897次閱讀
    薄膜<b class='flag-5'>晶體管</b>技術<b class='flag-5'>架構</b>與主流工藝路線

    寬帶隙WBG功率晶體管性能測試與挑戰(zhàn)

    晶體管性能得到了顯著提升,開啟了更高效率和更快動態(tài)響應的可能性。寬帶隙晶體管在現(xiàn)代電力系統(tǒng)中扮演著關鍵角色,包括開關電源(SMPS)、逆變
    的頭像 發(fā)表于 04-23 11:36 ?897次閱讀
    寬帶隙WBG功率<b class='flag-5'>晶體管</b>的<b class='flag-5'>性能</b>測試與挑戰(zhàn)

    多值電場型電壓選擇晶體管結構

    多值電場型電壓選擇晶體管結構 為滿足多進制邏輯運算的需要,設計了一款多值電場型電壓選擇晶體管。控制二進制電路通斷需要二進制邏輯門電路,實際上是對電壓的一種選擇,而傳統(tǒng)二進制邏輯門電路通常比較復雜
    發(fā)表于 04-15 10:24

    晶體管電路設計(下)

    晶體管,F(xiàn)ET和IC,F(xiàn)ET放大電路的工作原理,源極接地放大電路的設計,源極跟隨器電路設計,F(xiàn)ET低頻功率放大器的設計與制作,柵極接地放大電路的設計,電流反饋型OP放大器的設計與制作,進晶體管
    發(fā)表于 04-14 17:24

    晶體管電路設計(上) 【日 鈴木雅臣】

    晶體管和FET的工作原理,觀察放大電路的波形,放大電路的設計,放大電路的性能,共發(fā)射極應用,觀察射極跟隨器的波形,增強輸出電路的設計,射極跟隨器的性能和應用電路,小型功率放大器的設計和制作
    發(fā)表于 04-14 16:07