国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

工程師說 | 面向AD/ADAS的SoC的AI性能優(yōu)化

瑞薩電子 ? 來源:未知 ? 2023-07-27 18:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要

本文介紹了瑞薩在早期設計階段針對自動駕駛AD)和高級駕駛輔助系統(tǒng)(ADAS)的SoC中用于AI處理的深度神經(jīng)網(wǎng)絡(DNN)加速器的性能、電路尺寸和功耗的工作內(nèi)容。

Yuji Obayashi

Principal Software Engineer

背景

近年,隨著深度學習(DeepLearning)人工智能(AI)技術(shù)的進步,我們的生活中出現(xiàn)了許多直接有益的應用場景,例如自動翻譯精度的提升和根據(jù)消費者喜好的個性化推薦。截至2023年,AI在某些領域已經(jīng)成為產(chǎn)品和服務中不可或缺的應用,其中之一就是自動駕駛(AD)和先進駕駛輔助系統(tǒng)(ADAS)。

以深度神經(jīng)網(wǎng)絡(DNN)為代表的最新人工智能模型的處理需要大規(guī)模的并行計算,因此在PC開發(fā)中通常使用通用的GPU進行并行計算。另一方面,用于AD和ADAS的SoC多數(shù)搭載了專用電路(以下簡稱加速器),實現(xiàn)了低功耗和高性能的DNN處理。然而,在SoC開發(fā)的早期階段,確認搭載的加速器能否在實際所需的DNN中提供足夠的性能通常并不容易。性能比較的指標常常使用加速器設計上的最大計算性能TOPS(Tera Operations Per Second)值,或者其與運行時消耗的功率相除得到的TOPS/W值。然而,由于加速器是針對特定處理的專用設計(*1),即使TOPS值足夠高,在實際所需的DNN中也可能由于存在無法高效處理的計算或數(shù)據(jù)傳輸帶寬不足等問題而無法提供足夠的性能。此外,加速器的功率增加可能導致整個SoC的功耗超過可接受的范圍。

(*1)專用設計:雖然使用通用GPU作為加速器也是可能的,但處理特定任務的硬件,可以在較小的電路規(guī)模和功耗下獲得更高的處理性能。例如瑞薩的車載SoC R-Car V3H、R-Car V3M和R-Car V4H搭載的加速器具有專為處理DNN中使用卷積操作進行特征提取的卷積神經(jīng)網(wǎng)絡(CNN)任務而設計的結(jié)構(gòu)。

隨著SoC開發(fā)的深入,由于性能不足或功耗過大等原因而進行設計變更的難度普遍增加,對SoC開發(fā)進度和開發(fā)成本的影響也隨之增加。因此,在開發(fā)面向車載AI設備的SoC時,確認搭載的加速器能否在實際顧客產(chǎn)品中所需的DNN中提供足夠的性能,并且功耗是否在可接受范圍內(nèi),已成為迫切的問題。

面向AD/ADAS的一般AI開發(fā)流程

在解釋如何解決上述問題之前,先簡單介紹一下AD/ADAS的AI開發(fā)流程。下面的圖1展示了在AD/ADAS中以軟件為核心,并包括部分SoC開發(fā)的AI開發(fā)流程的示例。

1f98864a-2c65-11ee-815d-dac502259ad0.png

圖1:AD/ADAS中AI開發(fā)流程的例子

圖1將整個開發(fā)工作分為六個階段,其中第2和第3階段為SoC電路設計,其他第1和第4-6階段為軟件開發(fā)。下面給出了每個階段的工作概述。

第一階段 AI Application/Service Common Development

利用PC和云環(huán)境,以應對市場需求和技術(shù)趨勢,開發(fā)面向AD/ADAS的AI應用程序和服務。

第二階段 AI Accelerator Detail Design

涵蓋了構(gòu)成加速器硬件的部件設計,如計算單元、內(nèi)部存儲器和數(shù)據(jù)傳輸單元。

第三階段 AI Accelerator Configuration

在第三階段中,第二階段中設計的組件被組合起來,以優(yōu)化面積、功率和性能之間的權(quán)衡,同時確定加速器在SoC中的配置以實現(xiàn)各自的設計目標。

第四階段 DNN Model Architecture Design

在第三階段中確定的加速器配置被用來優(yōu)化每個用于客戶產(chǎn)品的DNN網(wǎng)絡的結(jié)構(gòu)。

第五階段 DNN Inference Optimization

將針對經(jīng)過第四階段結(jié)構(gòu)優(yōu)化的每個網(wǎng)絡進行適用于加速器的代碼生成,并進行精度和處理時間的詳細評估。同時,將對代碼和模型數(shù)據(jù)進行優(yōu)化,以提高性能。

第六階段 Application Development

將使用第五階段中優(yōu)化的代碼和模型數(shù)據(jù),將AI處理部分嵌入到實際的自動駕駛等處理中,并進行應用的實現(xiàn)和評估。

瑞薩的工作

在上一節(jié)所示的AD/ADAS中的AI開發(fā)流程中,判斷實際使用的DNN是否能夠在所配備的加速器上提供足夠的性能,通常需要在決定加速器配置的第三階段AI Accelerator Configuration中進行決策。

傳統(tǒng)上,在這一階段的決策是通過使用類似加速器的現(xiàn)有SoC進行的基準測試結(jié)果來估計的,但對于因增加或改變功能而與現(xiàn)有SoC規(guī)格不同的部分,無法獲得基準測試結(jié)果,因此無法通過高度精確的估計來確定是否能達到設計目標。

瑞薩通過使用PPA Estimator(PPA:Performance,Power,Area)而不是現(xiàn)有的SoC基準測試來解決這個課題。PPA Estimator通過使用反映加速器每個組件設計的性能和功率計算模型,使性能和功耗在加速器配置最終確定之前得到估算。具體來說,列出可能的加速器配置(可改變的加速器參數(shù)的組合,如處理單元的數(shù)量和內(nèi)部存儲器的容量)進行評估,選擇其中一個配置并與要評估的一個DNN一起輸入PPA Estimator中,以獲得所需的執(zhí)行時間和功耗。然后,可以針對所需評估的加速器配置和DNN的數(shù)量進行重復操作,收集數(shù)據(jù),并找到最佳的加速器配置。如此,不僅可以確定一個特定的加速器配置和DNN組合是否有足夠的性能,而且還可以收集廣泛的數(shù)據(jù)并從中選擇最佳加速器配置。

此外,為了使第三階段AI Accelerator Configuration更加有效,瑞薩還通過將從PPA Estimator執(zhí)行結(jié)果中獲得的信息反饋給目標DNN的網(wǎng)絡模型,并行改進軟件方面的工作,也就是進行硬件-軟件聯(lián)合設計(co-design)。AI Accelerator Configuration階段的工作流程如下圖2所示。

1fab0d06-2c65-11ee-815d-dac502259ad0.png

圖2:AI Accelerator Configuration工作流程

瑞薩已開始將PPA Estimator應用于從2023年開始的一些帶有AI處理加速器的AD/ADAS的SoC的開發(fā)中,并計劃逐步擴大應用范圍。瑞薩將利用PPA Estimator的高度精確性能尋找最佳配置以開發(fā)高性能、低功耗的車載AI加速器。

點擊文末閱讀原文獲取更多有關(guān)瑞薩當前和最新的車載AI SoC產(chǎn)品的信息。

1

END

1

瑞薩電子 (TSE: 6723)

科技讓生活更輕松,致力于打造更安全、更智能、可持續(xù)發(fā)展的未來。作為全球微控制器供應商,瑞薩電子融合了在嵌入式處理、模擬電源及連接方面的專業(yè)知識,提供完整的半導體解決方案。成功產(chǎn)品組合加速汽車、工業(yè)、基礎設施及物聯(lián)網(wǎng)應用上市,賦能數(shù)十億聯(lián)網(wǎng)智能設備改善人們的工作和生活方式。更多信息,敬請訪問renesas.com


原文標題:工程師說 | 面向AD/ADAS的SoC的AI性能優(yōu)化

文章出處:【微信公眾號:瑞薩電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 瑞薩
    +關(guān)注

    關(guān)注

    37

    文章

    22481

    瀏覽量

    90876

原文標題:工程師說 | 面向AD/ADAS的SoC的AI性能優(yōu)化

文章出處:【微信號:瑞薩電子,微信公眾號:瑞薩電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學科的技能,涵蓋數(shù)學基礎、編程能力、算法理論、工程實踐以及業(yè)務理解等多個方面。 以下是具體技能及學習建議: 線性代數(shù)核心內(nèi)容:矩陣運算、特征值分解、向量空間等。應用場
    發(fā)表于 02-27 10:53

    瑞薩電子R-Car V4H ADAS SoC已應用于豐田最新RAV4車型

    與雷達感知、駕駛員狀態(tài)監(jiān)測等,助力實現(xiàn)更高水平的車輛安全性能 全球半導體解決方案供應商瑞薩電子今日宣布,其面向ADAS(高級駕駛輔助系統(tǒng))的車規(guī)級片上系統(tǒng)(SoC)R-Car V4H,
    的頭像 發(fā)表于 02-24 14:26 ?238次閱讀

    使用NORDIC AI的好處

    不依賴持續(xù)聯(lián)網(wǎng),整體系統(tǒng)可靠性更高。[Edge AI 概述; Nordic Edge AI 技術(shù)頁] 覆蓋從“小 MCU”到“高性能 SoC”的完整產(chǎn)品線 Neuton 模型 :超
    發(fā)表于 01-31 23:16

    瑞芯微SOC智能視覺AI處理器

    RK3568B2: 一款性能均衡、接口豐富的中高端AIoT應用處理器,是RK3568的優(yōu)化版本,主打穩(wěn)定與可靠性。CPU/GPU: 延續(xù)RK3568的4核A55 + G52 GPU架構(gòu),性能可靠
    發(fā)表于 12-19 13:44

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地

    SoC 開發(fā)流程,幫開發(fā)者省時間; 優(yōu)化下一代 RISC-V 設計的性能和能效,進一步拉高性能上限; 把 RISC-V 打造成能和傳統(tǒng)專有處理器架構(gòu)抗衡的方案,畢竟 RISC-V 的
    發(fā)表于 12-18 12:01

    電子發(fā)燒友工程師看!電子領域評職稱,技術(shù)之路更扎實

    、ADI 等廠商的技術(shù)對接資格。? 對嵌入式開發(fā)工程師來說,職稱是崗位競爭力的 “加分項”。隨著物聯(lián)網(wǎng)、AI 技術(shù)普及,“高級嵌入式開發(fā)工程師”“嵌入式系統(tǒng)架構(gòu)師(中級)” 等職稱,成了企業(yè)篩選
    發(fā)表于 08-20 13:53

    AI 芯片浪潮下,職場晉升新契機?

    芯片設計為例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個環(huán)節(jié)都考驗著工程師的專業(yè)素養(yǎng)。在設計一款面向智能安防領域的 AI 芯片時,需要深
    發(fā)表于 08-19 08:58

    AI的未來,屬于那些既能寫代碼,又能焊電路的“雙棲人才”

    的信號:AI真正的未來,不只屬于“算法天才”,更屬于那些既能寫代碼,又能焊電路的“雙棲工程師”。無論是在AI芯片、智能終端、機器人、邊緣計算還是大模型下沉的討論中,我們不斷聽到同一個問題:“誰能把它
    發(fā)表于 07-30 16:15

    智能駕駛核心器件:三星ADAS SoC性能MLCC解決方案

    (先進駕駛輔助系統(tǒng))技術(shù)不斷進步,對于SoC芯片的性能要求日益提升。為了滿足高性能SoC的電源管理需求,需要更加小型化、高容量的MLCC(多層陶瓷電容器)解決方案。貞
    的頭像 發(fā)表于 05-27 16:35 ?637次閱讀
    智能駕駛核心器件:三星<b class='flag-5'>ADAS</b> <b class='flag-5'>SoC</b>高<b class='flag-5'>性能</b>MLCC解決方案

    芯馳科技D9-Max:面向具身智能應用的高性能邊緣AI SoC

    科技股份有限公司CTO孫鳴樂詳細介紹了公司帶來的面向具身智能應用的高性能邊緣AI SoC D9-Max。 ? 芯馳科技是全場景智能車芯引領者,專注于提供高
    的頭像 發(fā)表于 05-13 10:34 ?7680次閱讀
    芯馳科技D9-Max:<b class='flag-5'>面向</b>具身智能應用的高<b class='flag-5'>性能</b>邊緣<b class='flag-5'>AI</b> <b class='flag-5'>SoC</b>

    面向AI與機器學習應用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是一款面向AI與機器學習應用的開發(fā)平臺,專為邊緣計算場景優(yōu)化設計。以下從核心配置、技術(shù)特性、應用場景及開發(fā)支持
    的頭像 發(fā)表于 04-11 18:33 ?2447次閱讀
    <b class='flag-5'>面向</b><b class='flag-5'>AI</b>與機器學習應用的開發(fā)平臺 AMD/Xilinx Versal? <b class='flag-5'>AI</b> Edge VEK280

    AI眼鏡的未來:SoC芯片與SD NAND的協(xié)同優(yōu)化

    AI眼鏡正以驚人的速度從概念走向現(xiàn)實。據(jù)行業(yè)預測,全球AI眼鏡出貨量將在2026年突破1000萬副,2030年更將飆升至8000萬副,市場規(guī)模超百億美元。這一變革的背后,是兩大核心技術(shù)——MK米客方德SD NAND存儲芯片與紳聚高性能
    的頭像 發(fā)表于 04-08 09:00 ?1632次閱讀
    <b class='flag-5'>AI</b>眼鏡的未來:<b class='flag-5'>SoC</b>芯片與SD NAND的協(xié)同<b class='flag-5'>優(yōu)化</b>

    一招拿捏電子工程師#被AI拿捏了 #電子工程師 #電子電工

    電子工程師
    安泰小課堂
    發(fā)布于 :2025年03月25日 17:30:51

    電子工程師如何利用AI革新設計范式

    AI重構(gòu)電子產(chǎn)品設計范式的進程中,工程師們應如何平衡創(chuàng)新與風險,以確保在提升設計效率和產(chǎn)品性能的同時,有效應對安全、隱私和數(shù)據(jù)質(zhì)量等挑戰(zhàn)?
    的頭像 發(fā)表于 03-19 15:17 ?1481次閱讀

    ADAS1000 adi

    電子發(fā)燒友網(wǎng)為你提供ADI(ADI)ADAS1000相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有ADAS1000的引腳圖、接線圖、封裝手冊、中文資料、英文資料,ADAS1000真值表,ADAS1000
    發(fā)表于 03-10 18:37
    <b class='flag-5'>ADAS</b>1000 adi