国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

?特斯拉機器學習超級計算機DOJO支持靈活適應新的算法和應用

lPCU_elecfans ? 來源:電子發燒友網 ? 作者:電子發燒友網 ? 2022-08-25 15:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/周凱揚)這年頭不少車企都開始自主研發自動駕駛系統,連帶部署數據中心和超算已經不是什么新鮮事了。除了特斯拉的DOJO和GPU超算以外,小鵬也在本月宣布與阿里云合作搭建了全國最大的自動駕駛智算中心“扶搖”,算力可達600PFLOPS,看來新一輪的軍備競賽很快就會拉開帷幕。

對于自動駕駛的開發來說,模型訓練至關重要,尋常的服務器CPU基本無法滿足這個負載需求,所以不少車企都在借助英偉達的GPU開展訓練,特斯拉也不例外。正巧今年的Hot Chips大會上安排了三場特斯拉的分享,都與特斯拉的AI與DOJO平臺有關,特斯拉的幾位自動駕駛與AI部門負責人也都透露了他們在軟硬件上的一些進展,就當是作為下個月底特斯拉AI日的前瞻了。

DOJO超算

特斯拉的DOJO是他們自研自用的機器學習超級計算機,采用了高度可擴展而且完全分布式的系統,對神經網絡訓練負載進行了專門的優化,支持靈活適應新的算法和應用。根據特斯拉Autopilot硬件工程師Emil Talpes的說法,DOJO從設計之初就是為了大型系統設計的,而不是基于目前已有的商用小系統,再把規模做大。

DOJO的基礎組成部分,就是它的D1裸片。D1基于臺積電7nm工藝,單個裸片面積占645mm2。大家都知道蘋果M1 Ultra的die size相當大,可哪怕是M1 Ultra的單個裸片大小也只有432mm2。D1采用了極度模塊化的設計,每個D1上共有354個DOJO處理單元,而且以2D陣列的形式物理和邏輯排布,單個D1在2GHz下的算力可達362TFLOPS。

由5x5排布的25個合格D1芯片(KGD)組成了一個DOJO訓練模塊,整個模塊從電、熱、機械結構上都是完全集成在一起的,模塊水平層面負責不同模塊之間的通信,而垂直層面則解決15kW的供電和散熱問題。

整個DOJO系統就是由DOJO訓練模塊按2D網格結構排列而成,網格邊緣配置了DOJO接口處理器(DIP)來提供共享內存支持。而本屆Hot Chips上,特斯拉終于放出了這一處理器的詳細情報。

表面看上去,DIP像是一張PCIe卡,而它實際上使用的也確實是32GB/s的PCIe 4.0接口,配有32GB的HBM內核,提供800GB/s的總內存帶寬。但這PCIe 4.0的接口只是用于連接主機,真正發揮其性能的是特斯拉自研的TTP協議接口,提供900GB/s的超大帶寬給訓練模塊。

訓練模塊的邊緣配置了5個DIP卡,如此一來每邊都提供了160GB的共享DRAM,并通過這5張卡實現4.5TB/s的最大帶寬。要想擴展網絡通信的話,比如SmartNIC或交換機,DIP也原生硬件支持標準以太網上的TTP通信,當然了選擇這種通信方式的話帶寬也會降低至50GB/s,延遲也會增加。

整個系統即一個ExaPOD,由10個機柜,超過100萬片D1 CPU組成,算力可達1.1EFLOPS。而這樣的算力為特斯拉帶來了前所未有的訓練性能,尤其是在自動標注上。

被機器取代的人工標注員

雖然是特斯拉本身的商用車走的純視覺方案,但特斯拉路測車隊并不局限于提供視頻片段,畢竟去年就有人發現特斯拉的路測車輛頂著激光雷達在收集數據。在特斯拉路測車隊提交的片段中,除了視頻數據以外,還有IMU、GPS和測距儀等傳感器給出的數據。

這些數據經過離線神經網絡后,根據汽車行駛軌跡進行靜態世界重構,同時根據移動物體和動力學對物體進行自動標注。特斯拉可以自行選擇需要進行標注的片段,比如查詢可視條件不佳下的最近車輛,系統會自動返回這些片段然后進行自動標注。再加上特斯拉的4D標注,也就是在標注一次后,同時標注所有相機中的多幀畫面,極大地加快了標注速度。根據特斯拉的說法,他們可以在一周之內收集并自動標注1萬個片段。

這也就是特斯拉引入DOJO超算的原因,雖然標注的工作量在不斷提升,但隨著機器學習硬件資源的增多,手動標注的占比越來越低,而自動標注開始占據主導,這或許才是為何特斯拉標注團隊開始裁員的真相。

仍在繼續擴大規模的GPU超算

DOJO作為一個純CPU的超算系統,能做到以上已經相當厲害了,然而我們也不能忘記了特斯拉的另外兩臺GPU超算。早在2021年,特斯拉最新的一臺GPU超算規模就已經達到了720個節點,每個節點包含8塊英偉達A100 80GB GPU,整個系統的總GPU數達到了驚人的5760塊。

根據英偉達給出的數據,每個A100的算力有312TFLOPS,這也就意味著這臺最新GPU超算的算力已經超越了E級,達到了可怕的1.8EFLOPS。不過這里的E級和我們平常說的E級超算還是有區別的,TOP500的那些超算跑分用的是LINPACK HPL,用到的是64位雙精度的格式,得出的實際應用性能。而英偉達的A100的312TFLOPS是基于16位半精度來算的,而且是峰值性能。

可即便如此,這臺超算的實力也能在TOP500上名列前茅,根據特斯拉前AI主管Andrej Karpathy的說法,單論算力(峰值)的話,特斯拉這臺GPU超算確實能在去年六月的超算榜上名列第五。

而近期,特斯拉負責AI基礎設施和AI平臺團隊的工程經理Tim Zaman宣布,特斯拉已經將這臺超算的規模再度升級,A100 80GB GPU的數量再度提升28%,達到了可怕的7360個。這價格十萬左右的GPU一下就添置近2000個,不得不承認特斯拉確實愿意下血本。Tim Zaman表示哪怕單論GPU數量,這臺超算也能排名世界第七了。

至于峰值算力,這臺超算目前大概還是在第五的位置,這是因為今年的前五席多出了兩位新晉選手,第一名的Frontier和第三名的LUMI都比這臺超算要強。而且特斯拉也并沒有提交LINPACK HPL的跑分結果,畢竟這套系統已經投入使用,特斯拉作為商業公司,也沒必要去停止手頭的訓練負載而追求跑分。DOJO的話,特斯拉并沒有公開升級其規模,上文中的1.1EFLOPS的峰值算力也是基于BF16的,所以也不適合拿來直接對比。

寫在最后

電動車時代的來臨給不少造車新勢力降低了門檻,然而自動駕駛技術的存在又將整個門檻拉高了一大截。從目前頭部企業的動向來看,搭建智算中心,拿高密度的計算資源去跑訓練或許是唯一的自研路線,這樣法規完善后,才能讓自動駕駛汽車在全國范圍內鋪開,自動駕駛也不會局限于試點技術。

但是否摸清楚了技術路線,是否愿意砸這個錢,以及回報率高低才是他們邁出這一步關鍵,畢竟要讓一個車企去組建團隊搞芯片設計,這個要求還是有些過分了,但僅僅是與云服務廠商合作打造這樣一個智算中心,同樣也得付出不小的成本。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 超級計算機
    +關注

    關注

    2

    文章

    482

    瀏覽量

    43377
  • 特斯拉
    +關注

    關注

    66

    文章

    6413

    瀏覽量

    131366
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136949

原文標題:?特斯拉的自動駕駛標注員正在被DOJO超算取代

文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    特斯拉AI芯片戰略升級,“史詩級”芯片接棒Dojo

    最好的AI芯片。 ? 就在8月份,特斯拉宣布關閉自研超級計算機Dojo團隊,原負責人Peter Bannon離職。馬斯克解釋稱,同時開發訓練與推理芯片導致資源分散,集中力量開發單一架構
    的頭像 發表于 09-09 09:01 ?7407次閱讀

    使用NVIDIA技術驅動的超級計算機助力開放科學研究

    五個備受矚目的 HPC 獎決賽入圍項目憑借 Alps、JUPITER 和 Perlmutter 超級計算機支持在氣候建模、流體模擬等領域取得了重大突破。
    的頭像 發表于 11-25 11:17 ?824次閱讀

    奧士康召開DGX Spark AI超級計算機項目表彰大會

    2025年9月22日,奧士康科技股份有限公司隆重召開DGXSparkAI超級計算機項目表彰大會,以表彰在客戶開發、產品研發、工程設計和批量生產等方面作出突出貢獻的核心團隊。
    的頭像 發表于 09-24 10:51 ?876次閱讀

    特斯拉Dojo重塑供應鏈,三星和英特爾分別贏得芯片和封裝合同

    電子發燒友綜合報道,外媒消息稱,特斯拉 (Tesla) 在發展其自動駕駛 AI 訓練的超級計算機Dojo”的過程中,正對其供應鏈進行一次全面而重大的調整。 過去
    的頭像 發表于 08-10 06:14 ?1.2w次閱讀
    <b class='flag-5'>特斯拉</b><b class='flag-5'>Dojo</b>重塑供應鏈,三星和英特爾分別贏得芯片和封裝合同

    傳iPhone 17 Pro起始存儲或為256GB 特斯拉解散Dojo超級計算機團隊 微軟大裁15000人 CEO承認深感愧疚

    特斯拉解散Dojo超級計算機團隊 據外媒爆料稱,特斯拉正在解散其Dojo
    的頭像 發表于 08-08 11:33 ?1210次閱讀

    NVIDIA助力AI超級計算機Isambard-AI投入使用

    英國布里斯托大學的超級計算機 Isambard-AI 采用 NVIDIA Grace Hopper 超級芯片,其 AI 算力達到了 21 ExaFLOPS,不僅是英國最快的系統,同時也是全球能效最高的系統之一。
    的頭像 發表于 07-28 15:07 ?1228次閱讀

    自動化計算機經過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經過工程設計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠在各種不同的極端環境中運行。自動化
    的頭像 發表于 07-21 16:44 ?620次閱讀
    自動化<b class='flag-5'>計算機</b>經過加固后有什么好處?

    自動化計算機的功能與用途

    工業自動化是指利用自動化計算機來控制工業環境中的流程、機器人和機械,以制造產品或其部件。工業自動化的目的是提高生產率、增加靈活性,并提升制造過程的質量。工業自動化在汽車制造中體現得最為明顯,其中許多
    的頭像 發表于 07-15 16:32 ?745次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    工業計算機與商用計算機的區別有哪些

    工業計算機是一種專為工廠和工業環境設計的計算系統,具有高可靠性和穩定性,能夠應對惡劣環境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其在各種工業自動化場景中
    的頭像 發表于 07-10 16:36 ?745次閱讀
    工業<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區別有哪些

    NVIDIA驅動的現代超級計算機如何突破速度極限并推動科學發展

    現代高性能計算不僅使得更快的計算成為可能,它正驅動著 AI 系統解鎖更多領域的科學突破。 高性能計算經歷了多次迭代,每一次都源于對技術的創造性再利用。例如,早期的超級
    的頭像 發表于 06-26 19:39 ?1261次閱讀
    NVIDIA驅動的現代<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>如何突破速度極限并推動科學發展

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機 Blue Lion,其算力比該中心現有的 SuperMUC-NG 高性能計算機提升了約 30 倍。這臺新的超級
    的頭像 發表于 06-12 15:39 ?1145次閱讀

    NVIDIA技術賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快超級計算機,其運行 HPC 和 AI 工作負載的速度是第二名的兩倍以上。
    的頭像 發表于 06-12 15:33 ?1425次閱讀

    NVIDIA助力全球最大量子研究超級計算機

    NVIDIA 宣布將開設量子-AI 技術商業應用全球研發中心(G-QuAT),該中心部署了全球最大量子計算研究專用超級計算機 ABCI-Q。
    的頭像 發表于 05-22 09:44 ?901次閱讀

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    的 DGX? 個人 AI 超級計算機。 ? DGX Spark(前身為 Project DIGITS)支持 AI 開發者、研究人員、數據科學家和學生,在臺式電腦上對大模型進行原型設計、微調和推理。用
    發表于 03-19 09:59 ?783次閱讀
       NVIDIA 宣布推出 DGX Spark 個人 AI <b class='flag-5'>計算機</b>

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數據的支持范圍。在增加這項支持后,該平臺將能夠用于開發低功耗、低內存的邊緣AI視覺模型。這將給諸多應用領域的
    的頭像 發表于 03-11 15:11 ?813次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b>視覺的<b class='flag-5'>支持</b>