国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達最新推出的自動駕駛芯片Atlan詳解

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:佐思汽車研究 ? 2021-04-19 14:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達在2019年12月推出Orin后沉寂一年半推出新一代自動駕駛SoC,即Atlan,從命名來看,Nvidia 還在使用《海王》(Aquaman)系列中的名字。在2019年開始,Nvidia宣布的Orin SoC,就是以亞特蘭蒂斯的第一統治者命名的。而最近 Nvidia 宣布了以 Orin 之父命名的 Atlan SoC。相對Orin,Atlan可謂顛覆性的,與Orin遠非一個系列的產品,與其說它是一個車載芯片,不如說它是一個大型數據中心服務器芯片,不太考慮成本,不太考慮功耗。

英偉達從未公開Orin芯片的內部布局圖,但Atlan一開始就公布了,或許是對Atlan信心更足。

英偉達在2019年11月發布的Orin芯片官方圖片。不過在網上可以找到Orin的大致布局圖。

d3afb026-9f28-11eb-8b86-12bb97331649.png

Atlan不再沿用使用了近10年ARMv8的指令集,改為ARM Neoverse V1指令集。開發人員可能需要花大量精力來熟悉這種從未出現過的指令集。最大的改動是CPU使用了ARM針對服務器領域的Zeus架構,增加了Bluefield即DPU部分,增加了針對功能安全的安全島設計。 先來看CPU部分。

ARM在2019年3月針對服務器市場推出Neoverse平臺,按照計劃最初是Ares,即希臘神話里的戰神;2020年是Zeus,即希臘神話里二代天神中的最高神的宙斯;2021年是Poseidon,即希臘神話里的海神波塞冬。或許不會有Hades,冥王哈迪斯。至少這個系列代號可以用11代。

Neoverse平臺再分3個系列,分別是V、N、E三個系列,分別對應高性能、高效率、低功耗三大應用場景。V系列中第一個產品,順便說一下,N2平臺代號是Perseus,即希臘神話里的宙斯之子,砍下美杜莎腦袋的希臘英雄珀爾修斯。英偉達破天荒推出的CPU即是以宙斯為平臺的CPU。

V1可以看作ARM剛剛發布的ARM v9指令集的SVE強化版,ARM v9指令集中最大變化就是增加了SVE,SVE(Scalable Vector Extension)是ARM AArch64架構下的下一代SIMD指令集,旨在加速高性能計算。 ARM v7的高級SIMD (即ARMNEON 或“MPE” 多媒體處理引擎) 指令集自2005年發布,已經面世十幾年了。ARM v7 NEON的主要特性如下:

支持8/16/32位整數操作,支持非IEEE兼容單精度浮點操作,支持指令條件執行

32個64位矢量寄存器,也可視為16個128位矢量寄存器

旨在CPU端加速多媒體處理任務

在升級到ARMv8架構時,AArch64 NEON指令集做出了許多改進,比如:

支持IEEE兼容單精度和雙精度浮點操作和64位整數矢量操作

2個128位矢量寄存器

這些改進使NEON指令集更適用于通用計算,而不僅僅是多媒體計算

但是到了現在,ARMv8的新市場需要更徹底的SIMD指令改進。需要能夠并行處理非常規數據和復雜數據結構,也需要更長的矢量,SVE因此而生,SVE旨在加速高性能計算。

128位的整數倍。 最高可支持2048位

不同的實現可以適應不同的應用場景,不用更改指令集

每通道預測

支持復雜嵌套循環和if/then/else條件跳轉, 沒有循環尾數。

聚集加載和分散存儲支持復雜數據結構,如步長數據存取、數組索引,鏈表等。

橫向操作

支持基本的reduction操作,降低循環依賴性

SVE2于2019年4月和V1一起發布,SVE和SVE2的優勢還在于其可變的向量大小,范圍從128b到2048b,從而允許向量的可變粒度為128b,無論實際運行的硬件是什么。純粹從向量處理和編程的角度來看,這意味著軟件開發人員將只需要編譯一次其代碼,并且如果將來某個CPU帶有本機512b SIMD執行管道,該代碼將能夠已經充分利用了單元的整個寬度。

d4842234-9f28-11eb-8b86-12bb97331649.jpg

SVE2是針對機器學習設計的,通用矩陣乘法GEMM指令是其最突出特色。我們都知道AI加速器就是乘和累加MAC的堆砌,其特色就是一次可以執行乘和加兩個指令。實際是一種矩陣乘法累加器,在ARM v8.6中也加入了GEMM指令,乘法累加器中,乘法要遍歷每一個矩陣中的數值(通常是像素),這是最費時間的地方,加法器則要快的多,ARM的CPU不能像AI那樣堆砌MAC,但是可以加速矩陣乘法,讓后端的多核處理器部分工作量大大減輕。這近似于一個超高速DSP,頻率不高,但帶寬很高。

V1的突出特色還有CCIX和CXL,也就是大名鼎鼎的小芯片chiplet,chiplet的概念其實很簡單,就是die級別的重用。設計一個系統級芯片,以前的方法是從不同的IP供應商購買一些IP,軟核(代碼)或硬核(版圖),結合自研的模塊,集成為一個SoC,然后在某個芯片工藝節點上完成芯片設計和生產的完整流程。 未來,對于某些IP,你可能不需要自己做設計和生產了,而只需要買別人實現好的die片,然后在一個封裝里集成起來,很像SiP( System in Package),但兩者有很大不同,chiplet是晶圓級的,晶圓制造的中段mid-end封裝,只有晶圓廠Foundry才能做,封裝之間是超高速的bump連線,SiP是芯片級的封裝,是專業封裝廠的業務范疇,是錫球級別的。 小芯片的另一個名字叫MCM,Multi-Chip-Module。 2017年英偉達、德州大學、亞利桑那州立大學、巴塞羅那超算中心、加泰羅尼亞理工大學聯合出品一篇研究論文:MCM-GPU: Multi-Chip-Module GPUs for Continued Performance Scalability,對此有詳細的研究,在2017年加拿大多倫多ISCA上發表。

簡單地說就是用4個小芯片合成一個大芯片,英偉達稱為MCM技術。

d5102522-9f28-11eb-8b86-12bb97331649.png

上圖為英偉達采用MCM-GPU和多GPU性能對比。英偉達在2019年VLSI大會上提出RC-18概念,采用36個小芯片。

不僅GPU或者說AI芯片可以這樣做,CPU也可以,這就是AMD在服務器領域崛起的關鍵,最典型的是AMD的32核(應該是32小芯片)EPYC,這種方式最大優點是成本低,如果將32核封裝到一塊芯片中成本是1,那它們的MCM方式只有0.59,換言之,節省了41%的成本。

把小芯片合成一個大芯片,貌似就是一個“膠水”大法,但實際門檻是很高的,能支持的只有臺積電CoWos和英特爾的EMIB工藝,英偉達一向不喜歡臺積電,更喜歡三星。和高通一樣,英偉達知道不能過分依賴臺積電,否則容易出現供應鏈問題,也就是后來英偉達基本放棄MCM路線。

回到Atlan,Atlan可能用了ARM V1提供的CXL小芯片,即內存擴展,減少內存于處理器間的物理距離是解決AI處理器內存瓶頸的最有效方式。CCIX比較復雜,可能下一代會用。

再來看Bluefield即DPU部分,2020年4月英偉達花70億美元收購了以色列芯片公司Mellanox Technologies, Ltd.(邁絡思科技有限公司),通過融合Mellanox的技術,新的NVIDIA將擁有從人工智能計算到網絡的端到端技術,以及從處理器到軟件的全堆棧產品,擁有足夠的規模去推進下一代的數據中心技術。

Mellanox的主要產品就是名為Bluefield的芯片,英偉達將其改名為DPU。其實際上是一個高級的網卡。DPU專門執行原本需要CPU處理的網絡、存儲和安全等任務。這就意味著如果在數據中心中采用了DPU,那么CPU的不少運算能力可以被釋放出來,按照英偉達的說法,一個DPU頂125個CPU的網絡處理能力。

英偉達計劃在2022年推出3代Bluefield。復雜一點的說法是DPU是一個可編程的電子部件,其處理數據流,數據可作為信息的復用包與組件傳輸。DPU具有中央處理單元(CPU)的通用性和可編程性,但專用于處理網絡數據包、存儲請求或分析請求上高效運行。DPU通過更大程度的并行性(可同時處理更多的數據),因而對比起CPU更勝一籌。

同時,DPU的MIMD架構相比圖形處理單元(GPU)的SIMD架構更為優秀,其每個請求都需要做出不同的決定并遵循不同的路徑通過芯片,從而使其區別于GPU 。也就是英偉達說的軟件定義網絡,Mellanox NVMe SNAP (軟件定義的網絡加速處理)技術可以為遠程存儲提供2.5M + IOPS讀/寫訪問,這是4KB塊大小時100Gb / s的線速性能。相比之下,入門級NVMe SSD可以提供帶有4 KB塊的300K IOPS。此外,BlueField-2 DPU毫不費力地以100 Gb / s的速度添加了IPSec加密和解密功能。

上圖為二代Bluefield,內含8個ARMA72,Atlan里的要處理數據帶寬遠小于傳統服務器,兩個A72足夠。Atlan里的DPU主要針對車載骨干以太網和外接的PCIe網絡,內置網絡控制器和PCIe交換,以太網可輕易支持到100G,PCIe則支持到第四代,也可以做數據采集車的網絡接口芯片,與超高速固態硬盤連接。不過物理層芯片還是繞不開Marvell、德州儀器博通

最后是功能安全隔離島,應該就是ARM發布的Cortex-R52。英偉達所說的功能安全島與ARM所說的安全島的宣傳詞都基本一致。R系列是ARM專門為實時性要求高的場合開發的內核,R52是R系列旗艦產品,之前英偉達芯片從未采用過R內核。

R52是ARM在2016年發布的專為自動駕駛安全市場供應的內核,Cortex-R52最高支持4核心鎖步技術,相比Cortex-R5,有35%的性能提升,上下文切換(亂序)提高14倍,入口搶占提高2倍,支持硬件虛擬化技術。 按照ARM的說法,簡單的中控系統可直接用Cortex-R52,但是像工業機器人ADAS(先進輔助駕駛)系統則建議配合Cortex-A、MaliGPU等提升整體運算。另外,ARM Cortex-R52通過多項安全標準認證,包括有IEC 61508(工業)、ISO 26262(車用)、IEC60601(醫療)、EN 50129(車用)以及RTCA DO-254(工業)等。2021年3月還推出了R52+架構。可以最高支持8個核心鎖步。 R52包括三大功能,軟件隔離:通過硬件實現的軟件隔離,意味著軟件功能互不干擾。對于安全相關的任務,這也意味著需要認證的代碼更少,從而節省了時間、成本和工作量。

支持多個操作系統:借助虛擬化功能,開發人員能夠在單個CPU內,使用多個操作系統來整合應用。這樣可以簡化功能的添加,而無需增加電子控制單元的數量。

實時性能:Cortex-R52+的高性能多核集群可為確定性系統提供實時響應能力,且在所有Cortex-R產品中產生的延遲最低。

Atlan擁有多達1000TOPS的算力,是Orin的4倍,看其內部布局,仍然是12個安培GPU模塊,與Orin差不多,面積似乎也差不多,似乎還略微小了點,只不過Atlan的CPU die 面積遠比Orin的要大,Atlan能取得1000TOPS的成績,主要功勞應該是CPU、DPU和存儲的功勞,單Ampere架構的改進不大可能取得如此高的提升。 Atlan是針對服務器超大規模模型而設計的,而自動駕駛車載模型的趨勢是越來越小,精度越來越低,已經有人喊出1比特精度。Atlan反其道行之,特別支持服務器領域常見而自動駕駛領域少見的BFloat16精度。 顯然英特爾對車載領域的興趣度在逐漸下降,無論是CPU還是DPU,都是借服務器領域的,而非專為車載領域開發。

而在ARM服務器這個領域,依靠與ARM的深度合作與深厚的技術積累,英偉達能像英特爾筆記本電腦那樣每兩年就產品換代一次,不過一款車的生命周期至少是7-8年,車廠可不會認同這樣的更新頻率。但英偉達不在意,英偉達核心業務還是顯卡和數據中心處理器,車載只是順手做的,發揮CPUGPUDPU的余熱。 而Orin的ARM A78內核是專為自動駕駛引進的新內核,在英偉達其他產品見不到A78的身影,足見對A78的重視,而Atlan只能見到對數據中心的重視。英偉達的另一個用意是拉上對手做算力軍備競賽,在宣傳上大造聲勢,壓迫對手必須跟進算力游戲,直到拖垮對手。其他廠家恐怕不會跟進這種算力數字游戲,這脫離了實際需求。Orin恐怕將是英偉達未來數年的主力產品。

原文標題:詳解英偉達最新自動駕駛芯片-Atlan

文章出處:【微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54010

    瀏覽量

    465978
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99174
  • 自動駕駛
    +關注

    關注

    793

    文章

    14881

    瀏覽量

    179806

原文標題:詳解英偉達最新自動駕駛芯片-Atlan

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何設計好自動駕駛ODD?

    為確定自動駕駛的可使用范圍,會給自動駕駛設置一個運行設計域(Operational Design Domain,ODD)。ODD的作用就是用來明確自動駕駛在什么情況下能工作,在什么情況下不能工作,給車設定“工作范圍”。
    的頭像 發表于 01-24 09:27 ?1506次閱讀

    黃仁勛:未來十年很多汽車是自動駕駛 英偉發布Alpamayo汽車大模型平臺

    最看好的AI落地場景就是自動駕駛。在演講中黃仁勛提到,未來十年,世界上很大一部分汽車將是自動駕駛或高度自動駕駛的。你期待嗎? 英偉發布Al
    的頭像 發表于 01-06 11:45 ?1085次閱讀

    今日看點:象帝先推出首款量產Imagination DXD GPU顯卡;小米汽車累計交付突破 50 萬臺

    英偉發布專注于自動駕駛的視覺語言動作模型 近日,英偉宣布發布了 Alpamayo-R,這是一款面向
    發表于 12-02 10:24 ?1061次閱讀

    不同等級的自動駕駛技術要求上有何不同?

    談到自動駕駛,不可避免地會涉及到自動駕駛分級,美國汽車工程師學會(SAE)根據自動駕駛系統與人類駕駛員參與駕駛行為程度的不同,將
    的頭像 發表于 10-18 10:17 ?2708次閱讀

    邊聊安全 | 以L3級自動駕駛為例,詳解DDT、DDT Fallback、MRC、MRM概念

    以L3級自動駕駛為例,詳解DDT、DDTFallback、MRC、MRM概念寫在前面:在自動駕駛技術迅猛發展的今天,動態駕駛任務(DDT)及其后備(DDTfallback)成為理解
    的頭像 發表于 09-05 16:20 ?4242次閱讀
    邊聊安全 | 以L3級<b class='flag-5'>自動駕駛</b>為例,<b class='flag-5'>詳解</b>DDT、DDT Fallback、MRC、MRM概念

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術要求上有何不同?

    [首發于智駕最前沿微信公眾號]自動駕駛技術的發展,讓組合輔助駕駛得到大量應用,但現在對于自動駕駛技術的宣傳,普遍是在乘用車領域,而對于卡車、礦車的自動駕駛發展,卻鮮有提及。其實在卡車、
    的頭像 發表于 06-28 11:38 ?1380次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術要求上有何不同?

    小鵬汽車在全球AI頂會展示下一代自動駕駛模型

    Driving),與Waymo、英偉、加利福尼亞大學洛杉磯分校(UCLA)、圖賓根大學(University of Tuebingen)等來自工業界和學術界的自動駕駛同行共同探討業界最新AI技術。
    的頭像 發表于 06-23 09:13 ?1155次閱讀

    自動駕駛安全基石:ODD

    電子發燒友網綜合報道 自動駕駛ODD(Operational Design Domain)即設計運行域,是指自動駕駛系統被設計為安全、有效運行的具體條件范圍。它定義了自動駕駛汽車在哪些環境、場景
    的頭像 發表于 05-19 03:52 ?6411次閱讀

    從游戲到智能駕駛英偉有哪些技術升級?

    [首發于智駕最前沿微信公眾號]在2025年國際消費電子展(CES 2025)上,英偉重磅發布了其最新一代車規級自動駕駛芯片“Thor”,并同步展示了在智能汽車領域的技術進展與合作布局
    的頭像 發表于 05-16 09:02 ?993次閱讀
    從游戲到智能<b class='flag-5'>駕駛</b>,<b class='flag-5'>英偉</b><b class='flag-5'>達</b>有哪些技術升級?

    偉創力攜手英偉與Torc開啟自動駕駛卡車新紀元

    近年來,自動駕駛技術的發展如火如荼。作為世界領先的汽車級計算平臺提供商的偉創力成為自動駕駛8級卡車商業化先驅——Torc的合作伙伴,并攜手技術巨頭英偉(NVIDIA),合作開發了用于
    的頭像 發表于 03-26 16:10 ?976次閱讀

    NVIDIA Halos自動駕駛汽車安全系統發布

    自動駕駛汽車的開發。正確的技術與框架對確保自動駕駛汽車駕駛員、乘客和行人的安全至關重要。 因此,NVIDIA 推出了NVIDIA Halos綜合安全系統,將 NVIDIA 的汽車硬件、
    的頭像 發表于 03-25 14:51 ?1175次閱讀

    理想汽車推出全新自動駕駛架構

    2025年3月18日,理想汽車自動駕駛技術研發負責人賈鵬在NVIDIA GTC 2025發表主題演講《VLA:邁向自動駕駛物理智能體的關鍵一步》,分享了理想汽車對于下一代自動駕駛技術MindVLA的最新思考和進展。
    的頭像 發表于 03-19 14:12 ?1094次閱讀

    【重磅揭秘】英偉Orin芯片自動駕駛新紀元的核心驅動力,工程師必備指南免費下載!

    自動駕駛技術飛速發展的當下,計算平臺的性能直接決定了技術創新的高度。英偉Orin芯片,作為當前行業內的標桿之作,正引領著自動駕駛邁向全新
    的頭像 發表于 03-12 19:11 ?2514次閱讀