国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何透過數字直剖本質評估AI芯片的真實性能?

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2021-05-03 18:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特斯拉 Hardware 3.0 的效率之謎

特斯拉在其推出的 Hardware 3.0 自動駕駛平臺中,采用自研芯片替代了Nvidia Drive PX2,其理論算力直線提升了 3 倍,而以 MAPS 方式來評估,其真實 AI 性能更是驚人的提升了 21 倍。具體而言,Hardware 2.0 時每秒只能處理 110 幀圖像,而現在則高達 2300 幀。

那么,Hardware 的效率提升應該如何認識呢?在“算力至上”的今天,如何透過數字直剖本質評估 AI 芯片的真實性能?

算力攀升,為什么卻看不到實用性?

隨著芯片制程技術的演進,摩爾定律的發展卻逐漸進入瓶頸期,這與當下計算 AI 計算需求量爆發式的增長顯得格格不入。追求純算力突破并不可持續,同時算力也并不代表汽車智能芯片“真實性能”,芯片計算效率也同樣需要關注。于是,軟硬結合、算法加持的 AI 芯片接過了跑贏新場景的接力棒。

當前,行業普遍以“TOPS”為單位來評估AI的理論峰值算力。盡管在目前主流的AI芯片性能基準測試( MLPerf )下很多頂級廠商頻繁刷新榜單記錄,但在實際場景下的算力有效利用率卻差強人意。

2b80db88-9572-11eb-8b86-12bb97331649.png

人們逐漸認識到,AI 芯片理論峰值算力并不一定能在實際運行中完全釋放。例如,一款擁有理論峰值算力為 16 TOPS 的芯片,在計算不同模型時甚至會有接近 80% 的差異。此外,在卷積神經網絡任務實測中,從 2014 年到 2019 年,最好的神經網絡計算效率相差了 100 倍,相當于計算效率每 9 個月翻一倍,遠快于每 18 個月翻倍的摩爾定律。因此在模型算法演進速度遠快于芯片性能提升的速度的現在,不僅需要算力更高的芯片,也需要更合理的性能評估方法幫助用戶選擇適合的 AI 芯片。

對這些 AI 時代出現的新變化,以地平線為代表的 AI 芯片企業認為,單純依賴于 PPA 芯片設計指標,很容易陷入算力至上的“誤區”,但算力并不是完全反應芯片性能唯一評估標準。因此,地平線提出了 MAPS(Mean Accuracy-guaranteed Processing Speed)概念和評估方法,以此作為檢驗 AI 性能的真正標準。通俗來說,就是在特定的 AI 應用領域,看芯片處理 AI 任務的速度和精度,即“多快”和“多準”。

MAPS 動態評估芯片真實 AI 性能

隨著 AI 算法的不斷演進,幾乎每 10-14 個月,相同的計算精度計算量可以下降一半。這種提升與算法設計的精妙程度息息相關,但算法的快速演進也對計算架構提出巨大的挑戰,尤其是對傳統通用的并行架構而言,例如亟需高效AI專用處理器的自動駕駛場景。

MAPS 其實是在物理算力的基礎上,通過對大量模型的測試,綜合各個模型的速度(正比與物理算力*實際利用率)和準確率得到的最佳方案的量化結果。它更聚焦于使用戶能夠通過可視化的圖表直觀的感知 AI 芯片真實算力。正如對于汽車來說,馬力(單位: HP)不如百公里加速時間(單位:秒)更真實反映整車動力性能;算力(單位: TOPS)并不反映汽車智能芯片實際性能,而每秒準確識別幀率 MAPS(單位: FPS)才是更真實的性能指標。

2bb9df64-9572-11eb-8b86-12bb97331649.png

MAPS=最佳模型多邊形面積/(精度上界—精度下界),其中橫軸反應幀率,縱軸反應精度

此外,在自動駕駛中應該如何對速度和精度做取舍呢?現實生活中我們經常遇到一些極端的案例,例如當汽車遭遇小孩子橫穿馬路的突發狀況時,如果自動駕駛識別延時過高,會剎車不及時;如果精度不夠,則會造成無法識別。在很多類似的場景中,我們往往面臨既要“快”,又要兼顧“準”的境況。而在 MAPS 評估方法下,我們可以清晰看到幀率和精度之間的動態關系,這也是其對實際場景的重要價值之一。

更高級別自動駕駛需要多少“FPS”?

軟件定義的汽車的趨勢下,未來汽車正逐步成為四個輪子上的超級計算機。可以清晰預見的是,電動車賣點不是車,而是「智能」,這是一個堪比計算機誕生級別的創新。

特斯拉在 Hardware 3.0 中,采用其自研 AI 芯片 FSD Chip 替代了 Hardware 2.5 中的 Nvidia Drive PX2,算力從 24 TOPS 提升到了 72 TOPS,但運行同樣模型的精度卻驚人的提升了 21 倍。具體而言,Hardware 2.0 時每秒只能處理 110 幀圖像,而現在則高達 2300 幀。除了絕對算力的提升,額外提升則來自于利用率的提升。同時特斯拉也宣布針對 Hardware 3.0 重寫自動駕駛軟件,從而在 2020 年 10 月推出了 FSD beta,這是唯一不受場地限制、大規模測試的自動駕駛方案。

特斯拉革命性技術的重構與 MAPS背后體現的理念有相通之處:提升物理算力(HW 3.0 提升 3 倍)、提升利用率(提升近 2 倍),找到最佳的速度和準確率提升(重寫自動駕駛軟件),使得特斯拉從簡單場景的 NOA 一步步突破到不受限的自動駕駛。而地平線在芯片設計之中一直貫徹 MAPS 背后的技術理念,關注提升物理算力的同時關注利用率的提升,并且不斷把算法發展趨勢,使得軟硬件可以協同共振,發揮最高效能。

為了助力汽車廠商突破“特斯拉困境”,實現高級別自動駕駛的落地。地平線即將推出的征程 5 MAPS 整體跑分高達 3020 FPS,其中 MAPS@COCO (檢測任務COCO MAPS) 跑分可高達 116,而 Nvidia Xavier MAPS@COCO 為 41 FPS (GPU&DLA@32W mode ),如此高的性能將助力車廠加速實現自動駕駛方案的落地。

驅動新基建數字底座,需要有算力也要有效率。自成立以來,地平線便致力于兼備算力與效率的高性能芯片。未來,地平線將推出性能更強大的征程6,其不僅在功耗、面積優化的基礎上,同時在MAPS上繼續提升一個數量級,助力全行業共同努力進一步大幅提升自動駕駛的安全性。

原文標題:不看算力看效率,更高級別的自動駕駛需要多少 “FPS”?

文章出處:【微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 特斯拉
    +關注

    關注

    66

    文章

    6413

    瀏覽量

    131355
  • AI
    AI
    +關注

    關注

    91

    文章

    39773

    瀏覽量

    301372
  • 自動駕駛
    +關注

    關注

    793

    文章

    14881

    瀏覽量

    179803

原文標題:不看算力看效率,更高級別的自動駕駛需要多少 “FPS”?

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何評估憶聯Gen5 eSSD UH812a在AI場景中的性能表現

    隨著AI大模型進入萬億參數時代,傳統存儲性能測試已難以真實反映存儲系統在實際訓練場景中對成本與效率的核心影響。為此,全球權威AI基準測評組織MLCommons正式推出MLPerf St
    的頭像 發表于 02-05 09:56 ?988次閱讀
    如何<b class='flag-5'>評估</b>憶聯Gen5 eSSD UH812a在<b class='flag-5'>AI</b>場景中的<b class='flag-5'>性能</b>表現

    RK3576 能否替代 RK3588?一文看懂 6TOPS 工業 AI SoC 的真實性能差距與選型邏輯

    + 6TOPS NPU ,那 RK3576 是否可以替代 RK3588?價格更低、功耗更低,是不是更合適批量落地?真實性能差距到底有多大? 如果你也有這些疑問,本篇文章一次性講清楚,不玩虛的——我們直接逐項拆解,并在每段加入性能差異百分比,讓你快速看懂差異有多大,選型不
    的頭像 發表于 01-23 16:22 ?449次閱讀
    RK3576 能否替代 RK3588?一文看懂 6TOPS 工業 <b class='flag-5'>AI</b> SoC 的<b class='flag-5'>真實性能</b>差距與選型邏輯

    探索RTDTTP4200W066A:4.2kW數字無橋圖騰柱PFC評估板的卓越性能

    探索RTDTTP4200W066A:4.2kW數字無橋圖騰柱PFC評估板的卓越性能 在電力電子領域,高效的功率因數校正(PFC)技術一是研究和應用的熱點。今天,我們將深入探討Rene
    的頭像 發表于 12-26 16:00 ?414次閱讀

    如何專業評估UPS電源的性能與架構:一份面向決策者的終極指南

    在關鍵業務運營中,選擇一臺合適的UPS電源(不間斷電源)是一項具有長期影響的技術決策。面對紛繁的產品參數與營銷話術,技術決策者常感到困惑:究竟如何穿透表象,評估UPS電源的真實性能與架構價值?本文
    的頭像 發表于 12-11 08:38 ?349次閱讀
    如何專業<b class='flag-5'>評估</b>UPS電源的<b class='flag-5'>性能</b>與架構:一份面向決策者的終極指南

    一文理解模數轉換器中的有效位數

    隨著測量精度要求提升,有效位數(ENOB)已成為評估ADC、數字示波器真實性能的核心指標。ENOB由IEEE定義,綜合了噪聲、抖動、非線性失真等誤差,反映設備在實際使用中的“有效分辨率”。
    的頭像 發表于 10-09 11:01 ?3093次閱讀
    一文理解模數轉換器中的有效位數

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現實世界的知識整合。 3、測試時計算 測試時計算(TTC)是指在模型推理階段利用額外的計算資源來提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對AGI的意義
    發表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    主要步驟: ①溯因②假說③實驗 1、科學推理的類型 ①演繹②歸納 2、自動化科學發現框架 AI-笛卡兒-----自動化科學發現框架,利用數據和知識來生成和評估候選的科學假說。 4項規則:三、直覺
    發表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構

    的同時,能夠利用更小、更快的數字格式,提升模型的整體性能。 1.3Transformer 模型中的矩陣乘法計算 2、存內計算AI芯片 存內計算已經成為應對大模型不斷增加的計算量和能耗
    發表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,FPGA屬于AI
    發表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導體芯片技術加以實現。 而大腦是一個由無數神經元通過突觸連接而成的復雜網絡,是極其復雜和精密的。大腦在本質
    發表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術與創新未來》一書是姊妹篇,由此可見作者在AI
    發表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    芯片設計為例,從最初的架構選型,到算法適配、性能優化,每個環節都考驗著工程師的專業素養。在設計一款面向智能安防領域的 AI 芯片時,需要深入研究安防場景下圖像識別算法的特點,針對性地
    發表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請于9月3日前,前往【書籍評測活動NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。 如有疑問請 添加小助手微信
    發表于 07-28 13:54

    Splashtop 成功入選 TrustRadius Trusted Seller 榜單,以透明與真實引領遠程連接

    近日,全球權威技術評測平臺TrustRadius基于企業產品信息真實性、用戶反饋響應效率及商業道德實踐等維度,正式公布「TrustedSeller」榜單。Splashtop憑借其在產品信息透明度
    的頭像 發表于 05-14 17:36 ?836次閱讀
    Splashtop 成功入選 TrustRadius Trusted Seller 榜單,以透明與<b class='flag-5'>真實</b>引領遠程連接

    是德科技推出AI數據中心構建器以驗證和優化網絡架構和主機設計

    ·?通過模擬真實工作負載驗證AI基礎設施的性能 ·?通過評估新算法、組件或協議提高AI訓練的性能
    的頭像 發表于 04-10 08:50 ?647次閱讀