国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

史上最大芯片將用于這兩個項目

汽車玩家 ? 來源:今日頭條 ? 作者:今日頭條 ? 2019-11-25 16:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年 8 月,集成 1.2 萬億個晶體管的“史上最大芯片”The Cerebras Wafer Scale Engine(以下簡稱 WSE)誕生,在 11 月 19 日召開的 Supercomputing 2019 大會上,該芯片制造公司 Cerebras Systems 推出了搭載該芯片的計算機系統————Cerebras CS-1,這也將是世界上最強大的 AI 計算系統。美國兩家國家實驗室是該公司的客戶,其中,阿貢國家實驗室已成功部署并宣布,將用這套系統來發現癌癥療法和理解黑洞碰撞。

圖 | Cerebras CS-1(來源:Cerebras Systems)

CS-1 搭載的并不是一個芯片,而是一整個晶圓。通常,硅芯片是從 8、10 或 12 英寸等不同規格的晶圓上單獨切下來的。而 Cerebras 把晶圓切割成一個很大的長方形,每個芯片都相互連接,可以使每個晶體管都能像整體一樣高速運轉。一個典型處理器可能在一個芯片上有 100 億個晶體管,而 CS-1 搭載的整個晶片上所有核的晶體管總數超過 1.2 萬億個。

在 AI 計算中,芯片尺寸至關重要,但是高級處理器必須要有專用的硬件和軟件系統相配合才能實現理想的性能。Cerebras 公司 CEO Andrew Feldman 在接受媒體采訪時說:“你無法將法拉利發動機放入大眾汽車中來獲得法拉利性能。如果你想獲得 1,000 倍的性能提升,你要做的就是消除瓶頸?!盋S-1 系統設計和 Cerebras 軟件平臺相結合,可以充分用到從 WSE 上的 40 多萬個計算內核和 18 GB 高性能片上存儲器中提取的每一點的處理能力。

GIF 圖 | Cerebras 晶片規模的引擎(來源:Cerebras Systems)

GPU 集群需要消耗數十個機架并且需要專有的 InfiniBand 進行集群不同,CS-1 不需要大量修改現有模型,并且用戶只需將基于標準的 100Gb 以太網鏈路插入交換機就可以啟動培訓模型。

CS-1 有 15 個機架,大概是 26 英寸高(66.04 厘米)。Andrew Feldman 表示,CS-1 是“最快的 AI 計算機”。CS-1 計算機的機器學習能力相當于數百架基于 GPU 的計算機能力,這些計算會消耗數百千瓦。但 CS-1 僅消耗 17 千瓦,占標準機架能耗的三分之一。他把 CS-1 和谷歌的 TPU 計算集群相比,強調谷歌的 TPU2 機器學習集群需要 10 個機架和超過 100 千瓦的功耗,才能提供一個 CS-1 機箱三分之一的性能。

Feldman 說:“我們是由 40 萬個專用 AI 處理器組成的 AI 機器。”CS-1 由 40 萬核、1 萬億晶體管大小的處理器芯片驅動,可以將原本需要至少幾周的大型神經網絡訓練任務縮短到幾分鐘甚至幾秒鐘。但是,Cerebras 并沒有提供用標準 AI 基準(如新的 MLPeRF 標準)衡量性能的數據。相反,它通過讓潛在客戶在 Cerebras 的機器上訓練他們自己的神經網絡模型來吸引潛在客戶。

另外,Cerebras 還公布了一些系統軟件的細節,該軟件允許用戶使用 Pytorch 和 Tensorflow 之類的 ML 標準框架來編寫他們的機器學習模型。強大的圖形編譯器可自動將這些模型轉換為 CS-1 的優化可執行文件,而豐富的工具集可實現直觀的模型調試和性能分析。

圖 | Cerebras 軟件系統允許用戶使用 Pytorch 和 Tensorflow 之類的 ML 標準框架來編寫他們的機器學習模型(來源:Cerebras Systems)

這是如何實現的呢?通過解決一個優化問題,確保所有層以大致相同的速度完成它們的任務處理,且與相鄰層是連續的。這樣信息就可以實現在網絡中暢通無阻。該軟件可以在多臺計算機上執行這個優化問題,如果把 32 個 CS-1 連接在一起,那么這一組計算機所構成的大型計算機的性能可以提高約 32 倍。

Feldman 說:“GPU 集群無法實現相同的效果,你得到的不是一個大型計算機的算力,仍然是一堆小機器所能實現的算力。”他認為 CS-1 和 GPU 集群形成了鮮明的對比。

CS-1 的第一個應用是預測癌癥藥物反應,這是美國能源部和美國國家癌癥研究所合作的一個項目。能源部負責人工智能與技術的副部長 Dimitri Kusnezov 在一份聲明中說:“在能源部,我們相信公私合作是加速美國人工智能研究的重要組成部分?!薄拔覀兤诖c Cerebras 建立長期而富有成效的合作關系,這將有助于定義下一代人工智能技術,并改變能源部的運作、業務和使命?!被蛟S這也是 Feldman 能籌集到數億美元并雇用大量員工的原因。

圖 | 阿貢實驗室(Argonne National Laboratory)

阿貢實驗室與 Cerebras 的合作已經有兩年了。其計算總監 Rick Stevens 在新聞發布會上表示:“通過部署 CS-1,我們大大縮短了神經網絡的訓練時間,使我們的研究人員能夠更高效地開展深度學習研究,在癌癥、創傷性腦損傷以及當今和未來對社會有重要意義的其他領域取得重大進展?!?/p>

阿貢實驗室是全球最大的超級計算機站點之一,而 CS-1 可以使這個站點比現有的 AI 加速器得到 100 到 1000 倍的提升,有望在 2021 年實現 Aurora 百萬兆級超算的能力。一臺百萬兆級的計算機一瞬間進行的計算量,相當于地球上的所有人每天每秒都不停地計算四年。

除了用在研究抗癌藥物之外,該系統還將被用來幫助理解黑洞碰撞行為及其引力波。此前做過類似研究的 Theta 超級計算機,在研究黑洞碰撞問題時需要調動超算所配置的 4392 個節點中的 1024 個節點,每個節點包含了一個 64 核處理器和 16 GB 的高帶寬封裝內存(MCDRAM),192 GB 的 DDR4 RAM 和 128 GB 的 SSD。

Cerebras 的另一個客戶勞倫斯·利弗莫爾國家實驗室也來頭不小,擁有世界排名第三的 Sequoia 超級計算機。CS-1 也有望進一步增強其模擬計算能力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20255

    瀏覽量

    252329
  • 晶體管
    +關注

    關注

    78

    文章

    10396

    瀏覽量

    147772
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301447
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    兩個RS485-Modbus主站如何通訊

    本產品能很好解決Master-1主站向模塊寫入數據,Master-2主站讀取數據;Master-2主站向模塊寫入數據,Master-1主站讀取數據。由此解決兩個主站之間的互相讀通信難題。
    發表于 02-08 15:32 ?0次下載

    使用博圖(TIA Portal)監控PROFINET從站通訊狀態的兩個方法

    如何使用博圖監控Profinet從站通訊狀態,這里有兩個方法供你選擇。 方法一 | 使用DeviceStates指令 創建全局數據塊 在博圖項目中,創建一全局數據塊(DB),用于存儲
    的頭像 發表于 01-17 11:21 ?1242次閱讀
    使用博圖(TIA Portal)監控PROFINET從站通訊狀態的<b class='flag-5'>兩個</b>方法

    曙光存儲連續斬獲兩個行業獎項

    近期,曙光存儲連續斬獲兩個行業獎項,自研技術產品在國產突破、AI行業應用等方面的成果獲得廣泛關注。
    的頭像 發表于 01-15 16:28 ?2507次閱讀

    時鐘芯片與晶振:微小世界的兩個巨人

    如今,我們常常遇到一些看似相似,但實則截然不同的概念。今天,我們就來探討一下時鐘芯片與晶振的區別。首先,我們要了解什么是時鐘芯片和晶振。簡單來說,它們都是電子設備中的重要組成部分,用于提供穩定的時間
    的頭像 發表于 12-30 17:44 ?6852次閱讀
    時鐘<b class='flag-5'>芯片</b>與晶振:微小世界的<b class='flag-5'>兩個</b>巨人

    FreeRtos 能否同時使用兩個 CPU?

    的情況下,CM0 更愿意專門用于管理外設。 - 是否有在 CM0 和 CM4 中同時運行代碼的簡單示例或教程? - FreeRtos 能否同時使用兩個 CPU?
    發表于 11-11 08:28

    鋰電池生產“發熱”難題?這兩個模塊輕松搞定!

    在鋰電池生產與測試過程中,溫度管理是確保品質與安全的關鍵環節。本文將探討鋰電池生產測試中的溫度挑戰,并推薦款適合的測溫模塊,幫助工程師更好地進行溫度監測與管理,提升鋰電池生產的品質與安全性。前言在
    的頭像 發表于 10-10 11:38 ?426次閱讀
    鋰電池生產“發熱”難題?<b class='flag-5'>這兩個</b>模塊輕松搞定!

    硬件SPI兩個CS操作兩個norflash,怎么互斥操作兩個norflash?

    硬件SPI兩個CS操作兩個norflash,怎么互斥操作兩個norflash,有一norflash被模擬成U盤,會在中斷中操作spi。
    發表于 09-26 06:18

    基本半導體連獲兩個行業獎項

    近日,基本半導體憑借在碳化硅模塊領域的突出表現,連獲“國產SiC模塊TOP企業獎”和“年度優秀功率器件產品獎”兩個行業獎項。
    的頭像 發表于 09-05 16:31 ?1097次閱讀

    是否有可能在 FX10 中嵌入一電源傳輸堆棧并使用這兩個引腳進行通信?

    電阻接地。這應該允許 FX10 知道電纜連接方向并相應地控制內部 USB 多路復用器。 將來是否有可能在 FX10 中嵌入一電源傳輸堆棧并使用這兩個引腳進行通信?
    發表于 07-21 07:59

    請問一藍牙芯片可以同時傳輸兩個不同的數據嗎?

    現在有兩個不同的數據,想用一藍牙芯片進行傳輸,可以做到嗎?求解
    發表于 07-07 06:28

    如何理解MDD肖特基整流橋的最大反向電壓與平均電流規格?

    項至關重要的核心參數。本文將結合實際應用場景,幫助工程師深入理解這兩個規格的含義及選型考量。一、最大反向電壓(VRRM):電路耐壓設計的基石最大反向電壓,通常標記為VR
    的頭像 發表于 06-16 10:35 ?869次閱讀
    如何理解MDD肖特基整流橋的<b class='flag-5'>最大</b>反向電壓與平均電流規格?

    看到STM8L152用兩個IO用兩個或非門檢測兩個通斷,是什么原理呢?

    圖中兩個按鍵開關是兩個干簧管,為什么不直接對GND設計來檢測這個干簧管通斷呢? 這樣設計的原理是什么?
    發表于 06-12 06:25

    用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶兩個 Rx 交換機端口和雙頻 TD-SCDMA skyworksinc

    電子發燒友網為你提供()用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶兩個 Rx 交換機端口和雙頻 TD-SCDMA相關產品參數、數據手冊,更有用于四頻 GSM
    發表于 05-29 18:31
    <b class='flag-5'>用于</b>四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶<b class='flag-5'>兩個</b> Rx 交換機端口和雙頻 TD-SCDMA skyworksinc

    永磁電機 VS 普通電機,這兩個有何區別?

    · 電機是現代工業的心臟,廣泛應用于各個領域。永磁電機和普通電機作為種主要類型,到底有何區別?今天小編帶你一起來了解下:? ü 運行效率: ①永磁電機因無需外部勵磁,顯著降低能量損耗,效率普遍高出
    的頭像 發表于 05-29 08:41 ?5015次閱讀

    ADAU1787四ADC、兩個DAC、帶音頻DSP的低功耗編解碼器技術手冊

    ADAU1787 是一款具有四輸入和兩個輸出的編解碼器,其中整合了兩個數字信號處理器 (DSP)。從模擬輸入到 DSP 內核再到模擬輸出的路徑已針對低延遲進行優化,適用于噪聲消除耳機
    的頭像 發表于 05-12 14:57 ?1518次閱讀
    ADAU1787四<b class='flag-5'>個</b>ADC、<b class='flag-5'>兩個</b>DAC、帶音頻DSP的低功耗編解碼器技術手冊