国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI新興應用通過帶可配置加速的片上系統器件來滿足嚴格性能、效率需求

YCqV_FPGA_EETre ? 來源:YXQ ? 2019-08-06 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著智能安全、機器人無人駕駛汽車等應用越來越依靠嵌入式人工智能技術來提高性能,交付全新的用戶體驗,傳統計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際要求。推斷引擎必須滿足嚴格定義的推斷精度,還受限于總線寬度,而且存儲器難以為最佳速度、效率和芯片面積進行調整優化。我們需要靈活應變的計算平臺來滿足運行一流卷積神經網絡 (CNN) 的嵌入式 AI 的要求。

放眼未來,適應于更多前沿神經網絡的靈活性是我們的主要關注點。今天廣受歡迎的 CNN 正加速被新型的先進架構所取代。然而,傳統的 SoC 設計要使用當前的神經網絡架構知識,從開發開始到未來部署通常需要大約三年時間。RNN 或 Capsule Network 等新型神經網絡可能會讓傳統 SoC 變得低效,也難以提供保持競爭力所需的性能。

嵌入式 AI 要滿足最終用戶期望,特別是要跟上可預見的未來不斷提升的需求,就必須采用更加靈活的自適應計算平臺。我們可利用用戶可配置的多核片上系統 (MPSoC) 器件,整合主應用處理器和可擴展的可編程邏輯結構,包含可配置的存儲器架構和滿足可變精度推斷所需的信號處理技術,從而滿足上述要求。

推斷精度

在傳統的 SoC 中,決定性能的特性如存儲器架構和計算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優化至晶體管層面,這就能根據需要讓推斷精度降低到 1 位。此外,這類器件還包含成千上萬可配置的 DSP slice,能高效處理乘積累加 (MAC) 計算。

能自由優化推斷精度,根據平方律提供剛好滿足需求的計算效率,也就是說單位的運算用 1 位核心執行,相對于用 8 位核心完成相同計算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經網絡的每層做出不同優化,從而以最大的效率提供所需的性能。

存儲器架構

除了通過改變推斷精度來提高計算效率之外,配置可編程片上存儲器的帶寬和結構能進一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對于運行相同推斷引擎的傳統計算平臺而言,片上存儲器可能達到 4 倍多,存儲器—接口帶寬可能達到 6 倍。存儲器的可配置性使得用戶能減少瓶頸,并優化芯片資源的利用率。此外,典型的子系統只有有限的片上集成高速緩存,必須與片外存儲設備頻繁交互,這就會增加時延和功耗。在 MPSoC 中,大多數存儲器交換都在片上進行,這就會大幅提高速度,而且相對于片外存儲器交互而言功耗降低超過 99%。

芯片面積

解決方案的尺寸也越來越重要,特別就采用移動 AI 的無人機、機器人或無人/自動駕駛汽車而言尤其如此。MPSoC 的 FPGA 結構上實現的推斷引擎可能僅占用傳統 SoC 八分之一的芯片面積,這就能讓開發人員在更小的器件中構建功能更強大的引擎。

此外,MPSoC 器件系列為設計人員提供了實現推斷引擎的豐富選擇,能支持最節能、成本效率最高、面積占用最小的方案,從而滿足系統性能要求。一些通過汽車應用認證的部件具備硬件功能安全特性,達到業界標準的 ISO 26262 ASIL-C 安全規范,這對自動駕駛應用而言至關重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統以及可擴展的可編程邏輯結構,這就能在單個芯片上整合控制處理、機器學習算法和安全電路,同時提供故障容錯功能。

今天,嵌入式推斷引擎可用單個 MPSoC 器件實現,功耗低至 2 瓦,這對移動機器人或自動駕駛汽車而言都是比較合適的功耗水平。傳統計算平臺即便現在也無法用這么低的功耗運行實時 CNN 應用,未來也不太可能在更嚴格的功耗限制條件下滿足更快響應和更復雜功能的日益嚴格的要求。基于可編程 MPSoC 的平臺能夠提供更高的計算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發人員不能在自己的項目中輕松地實現這些優勢,那么這種可配置型多平行計算架構的優勢就僅限于學術領域。成功需要適當的工具來幫助開發人員優化目標推斷引擎的實現。為了滿足有關需求,賽靈思不斷擴展開發工具生態系統和機器學習軟件堆棧,并與專業合作伙伴合作,一起簡化和加速計算機視覺和視頻監控等應用的實現。

面向未來的靈活性

利用 SoC 的可配置性為手頭應用創建最佳平臺,也使得 AI 開發人員能夠靈活地跟上神經網絡架構快速發展演進的要求。業界可能遷移到新型神經網絡的可能性,對于平臺開發人員來說是一個巨大的風險。可重配置的 MPSoC 通過重配置并用當前最先進的策略來構建最高效的處理引擎,能夠讓開發人員靈活地響應神經網絡架構方式的變化。

AI 越來越多地嵌入到各種設備中,包括工業控制、醫療設備、安全系統、機器人和自動駕駛汽車等。利用可編程邏輯結構的 MPSoC 器件的靈活應變加速技術,是提供保持競爭力所需的快速響應和高級功能的關鍵。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 賽靈思
    +關注

    關注

    33

    文章

    1798

    瀏覽量

    133455
  • AI
    AI
    +關注

    關注

    91

    文章

    39866

    瀏覽量

    301510

原文標題:靈活應變的加速是將人工智能從云端帶到邊緣的關鍵

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一機多用、極致靈活:1200W可配置電源——LMP系列

    自由配置多達6路不同規格的輸出,外形纖薄(1U),以寬輸出范圍(3.2~60V),高效節能、安全穩定、靈活可控為核心優勢,為市場提供高性能、高易用性且具備成本優勢的系統級解決方案。 可配置
    的頭像 發表于 02-10 14:16 ?201次閱讀
    一機多用、極致靈活:1200W<b class='flag-5'>可配置</b>電源——LMP系列

    重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地

    還有低授權成本,本來就是天生優勢! 再說說大家關心的應用場景,這次合作覆蓋的領域全是當下的熱門賽道: 物聯網與邊緣計算設備(重點滿足低功耗、高性能需求); 汽車電子系統,包括咱們關注的高級駕駛輔助
    發表于 12-18 12:01

    Amphenol Millipacs? Plus可配置連接器:電子設計的理想之選

    Amphenol Millipacs? Plus可配置連接器:電子設計的理想之選 在電子設備設計中,連接器的性能和適用性往往對整個系統的穩定性和性能起著關鍵作用。今天,我們
    的頭像 發表于 12-11 16:00 ?421次閱讀

    國產混合信號處理的重要突破:淺析PSOC 7020的可配置運算架構

    本文簡要介紹了國產PSOC?7020芯片內集成的關鍵運算電路模塊,闡述了其作為可編程系統(PSoC)的核心模擬處理能力。文章重點分析了其運算放大器、比較器、模數/數模轉換器等模塊的可配置
    的頭像 發表于 12-04 17:29 ?789次閱讀
    國產混合信號處理的重要突破:淺析PSOC 7020的<b class='flag-5'>可配置</b>運算架構

    RK3576驅動高端顯控系統升級:多屏拼控與AI視覺融合解決方案

    并行的情況下,也能保持流暢性能。 高帶寬擴展接口:配備 PCIe、USB 3.1、SATA 等接口,可滿足工業控制、視頻采集卡連接及高速數據傳輸的需求。 核心功能解析:重塑顯控系統
    發表于 11-21 17:51

    PD快充MOS管高性能低內阻SGT工藝場效應管HG5511D應用方案

    組成部分。 快充關鍵元器件性能適配方向 在 USB PD 快充電源方案中,同步整流用 MOS 管需滿足多維度性能要求,以適配快充場景的實際需求
    發表于 11-03 09:28

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    ②Transformer引擎③NVLink Switch系統④機密計算⑤HBM FPGA: 架構的主要特點:可重構邏輯和路由,可以快速實現各種不同形式的神經網絡加速。 ASIC: 介紹了幾種ASIC AI芯片
    發表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導體芯片技術加以實現。 而大腦是一個由無數神經元通過突觸連接而成的復雜網絡,是極其復雜和精密的。大腦在本質
    發表于 09-06 19:12

    PCIe協議分析儀能測試哪些設備?

    /ASIC加速器 測試場景:分析專用AI推理加速器與主系統的PCIe通信,優化數據傳輸和指令下發效率。 應用價值:提高推理吞吐量,確保
    發表于 07-25 14:09

    AI平臺能否終結磁性元器件“經驗主義”設計

    當前,磁性元器件行業正經歷重要變革,眾多新興技術的涌現正重塑著磁性元器件行業的發展格局。 尤其是AI技術在磁芯材料與磁性元器件設計優化中的應
    的頭像 發表于 07-22 14:15 ?883次閱讀
    <b class='flag-5'>AI</b>平臺能否終結磁性元<b class='flag-5'>器件</b>“經驗主義”設計

    人工合成石墨與天然石墨的差別

    電極等傳統領域,傲琪提供的天然石墨厚度≥0.1mm,通過UL防火認證,滿足大規模工業化生產需求。 ※ 人工石墨主戰場1. 消費電子:傲琪0.025mm超薄人工石墨
    發表于 05-23 11:22

    Intel-Altera FPGA:通信行業的加速引擎,開啟高速互聯新時代

    Agilex(高端)、Stratix(高性能)、Arria(中端)、Cyclone(低成本)等系列,滿足從數據中心到工業自動化的多樣化需求。技術特點:可重構性:支持“現場編程”,靈活適配AI
    發表于 04-25 10:19

    第二代AMD Versal Premium系列SoC滿足各種CXL應用需求

    第二代 AMD Versal Premium 系列自適應 SoC 是一款多功能且可配置的平臺,提供全面的 CXL 3.1 子系統。該系列自適應 SoC 旨在滿足從簡單到復雜的各種 CXL 應用
    的頭像 發表于 04-24 14:52 ?1281次閱讀
    第二代AMD Versal Premium系列SoC<b class='flag-5'>滿足</b>各種CXL應用<b class='flag-5'>需求</b>

    DevEco Studio AI輔助開發工具兩大升級功能 鴻蒙應用開發效率再提升

    對DeepSeek模型增強融合了RAG能力,從生成機制協同降低模型幻象,并同時提升生成模型的準確性和相關性。 RAG檢索增強的核心機制是通過“檢索-生成”分離架構,將模型輸出嚴格約束在可信數據范圍內
    發表于 04-18 14:43

    DeepSeek推動AI算力需求:800G光模塊的關鍵作用

    性能方面展現了出色的優勢,滿足當前AI算力需求的快速增長。 高可靠性: 光模塊經過溫度、靜電放電及機械耐久性等嚴格測試,確保在數據中
    發表于 03-25 12:00