国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

賽靈思分享:智能引擎中所的AI引擎技術分析

454398 ? 來源:Xilinx技術社區 ? 作者:Olivier Tremois ? 2020-10-11 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Olivier Tremois(AI 引擎工具市場營銷部門)和 Florent Werbrouck(賽靈思技術支持產品應用工程師

Versal ACAP 簡介

Versal 自適應計算加速平臺 (ACAP) 是基于 TSMC 7nm FinFET 工藝技術構建的最新一代賽靈思器件。它利用高帶寬片上網絡 (NoC) 將代表處理器系統 (PS) 的標量引擎、代表可編程邏輯 (PL) 的自適應引擎與智能引擎有機結合在一起。

本文將著重介紹智能引擎中所包含的 AI 引擎。

賽靈思 AI 引擎簡介

在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內存、數據流和級聯接口相連的二維AI 引擎拼塊陣列。在當前 ACAP 器件(例如,VC1902 器件)上,此陣列最多可包含 400 個拼塊。此陣列中還包含AI 引擎接口(位于最后一行),以便于陣列中的其它器件(PS、PL 和 NoC)進行交互。

AI 引擎接口包含PL 和 NoC 接口拼塊以及配置拼塊。從 PL 到 AI 引擎陣列的連接是使用 AXI4-Stream 接口通過 PL 和 NoC 接口拼塊來實現的。從 NoC 到 AI 引擎陣列的連接是使用 AXI4 存儲器映射接口通過 NoC 接口拼塊來實現的。

有趣的是,從中可以看到,只有在 NoC 到 AI 引擎拼塊之間才存在 AXI4 存儲器映射直接通信通道,在 AI 引擎拼塊到 NoC 之間卻并不存在。

注:PL 和 NoC 接口拼塊的精確數量因器件而異?!禫ersal 架構和產品數據手冊:簡介》(DS950) 中羅列了 AI 引擎陣列的大小。
https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-...

AI 引擎拼塊架構

現在,我們來詳細了解下此陣列,看看 AI 引擎拼塊的內部。

每個 AI 引擎拼塊都包含:

  • 1 個拼塊互連模塊,用于處理 AXI4-Stream 和存儲器映射 AXI4 輸入/輸出
  • 1 個存儲器模塊,其中包含 32 KB 數據內存,細分為 8 個內存 bank、1 個內存接口、DMA 和各種鎖定。
  • 1 個 AI 引擎

AI 引擎可訪問全部 4 個方向中的多達 4 個內存模塊(作為 1 個連續存儲器塊)。這意味著除了拼塊本地的內存,AI 引擎還可以訪問 3 個相鄰拼塊的本地內存(除非拼塊位于陣列邊緣)。

  • 北側內存模塊
  • 南側內存模塊
  • 東側或西側內存模塊(取決于 AI 引擎和內存模塊所在的行和相對布局)。

AI 引擎架構

AI 引擎屬于高度優化的處理器,包含下列主要特色:

  • 32 位標量 RISC 處理器(名為 Scalar Unit)
  • 1 個 512b SIMD 矢量單元(可提供矢量定點/整數單元)和 1 個單精度浮點 (SPFP) 矢量單元
  • 3 個地址生成器單元 (AGU)
  • 超長指令字 (VLIW) 功能
  • 3 個數據內存端口(2 個負載端口,1 個存儲端口)
  • 直接流傳輸接口(2 個輸入流,2 個輸出流)

AI 引擎陣列編程

AI 引擎拼塊按 10 或 100 為單位組成陣列。創建嵌入多項指令的單一程序用于指定并行性將是一項冗長且近乎不可能的任務。因此 AI 引擎陣列模型編程與 Kahn 處理網絡 (Kahn Process Networks) 之間的共通之處在于自主計算進程通過通信邊緣實現彼此互連,從而生成處理網絡。

(請參閱 https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf )

在 AI 引擎框架中,Graph 邊緣是緩存和數據流,而計算進程則被稱為內核。在Graph中,內核經過例化,彼此相連并連接到設計其余部分(NoC 或 PL)。

編程流程分為 2 個階段:

單內核編程:

內核用于描述特定計算進程。每個內核都將在單一 AI 引擎拼塊上運行。但請注意,多個內核可在同一個 AI 引擎拼塊上運行,并共享處理時間。任意 C/C++ 代碼均可用于對 AI 引擎進行編程。標量處理器將處理大部分代碼。如果您的目標是設計高性能內核,那么應考慮采用矢量處理器,它使用稱為內部函數的專用函數。這些函數專用于 AI 引擎的矢量處理器,支持您從 AI 引擎中發掘出巨大的處理性能。賽靈思將提供預構建內核(包含在庫內),以供用戶在其定制 Graph 中使用。

Graph 編程:

賽靈思將提供 C++ 框架以從內核創建Graph。此框架包含 Graph 節點和連接聲明。這些節點可包含在 AI 引擎陣列內或可編程邏輯(HLS 內核)中。為了完全掌握內核位置,將有一系列方法可用來約束布局(內核、緩存、系統內存等)。Graph 將例化并使用緩存和數據流將內核連接在一起。它還將描述 AI 引擎陣列與其它ACAP 器件(PL 或 DDR)之間的雙向往來數據傳輸。

賽靈思將提供預構建 Graph(包含在庫內),以供用戶在其應用中使用。

在運行時以及仿真期間,AI 引擎應用由 PS 進行控制。

賽靈思將根據應用的操作系統提供多種 API,如下所述。

  • Xilinx Run Time (XRT) 和 OpenCL,適用于 Linux 應用
  • 裸機驅動程序

編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 賽靈思
    +關注

    關注

    33

    文章

    1798

    瀏覽量

    133426
  • AI
    AI
    +關注

    關注

    91

    文章

    39776

    瀏覽量

    301372
  • 可編程邏輯
    +關注

    關注

    7

    文章

    526

    瀏覽量

    45402
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    易百納攜多模態AI桌面機器人——Kubee Robot亮相2025火山引擎冬季FORCE大會

    的 Kubee Robot AI 桌面機器人亮相,該產品搭載海 AI 主控與星閃技術,以 HongOU Lite 模組為內核,深度融合豆包大模型能力,實現多模態
    的頭像 發表于 12-27 11:30 ?97次閱讀
    易百納攜多模態<b class='flag-5'>AI</b>桌面機器人——Kubee Robot亮相2025火山<b class='flag-5'>引擎</b>冬季FORCE大會

    必馳場景化推理AI重塑智能交互

    AI技術從“感知”走向“認知”的今天,推理能力正成為推動人工智能向更高階躍遷的核心引擎。
    的頭像 發表于 12-12 11:31 ?741次閱讀

    帶寬7.2Tb/s!海光電推出HI-ONE硅光引擎

    電子發燒友網綜合報道 在最近,海光電發布了其全新的HI-ONE硅光引擎,這是基于其III-V光芯片、硅基半導體芯片技術和先進光電封裝平臺能力,面向AI時代的高密度光電互連推出的新一代
    的頭像 發表于 10-27 06:50 ?5811次閱讀

    光庭信息亮相2025上海虛幻引擎技術開放日

    專家與前沿科技企業,共同解鎖虛幻引擎(UE)技術的未來邊界。光庭信息智能座艙事業部技術總監陳治在汽車峰會專場發表《虛幻引擎助力3D
    的頭像 發表于 08-28 15:30 ?1297次閱讀

    特威第二屆機器視覺大會即將舉辦

    去年盛夏,首屆易特威機器視覺技術大會點燃了行業創新的火花。易驚艷亮相的 TJ375
    的頭像 發表于 08-13 09:53 ?1092次閱讀

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發的新一代AI大模型。其核心優勢
    發表于 07-16 15:29

    軟通動力攜手華為云推出AI知識引擎與數據工程融合創新解決方案

    在華為開發者大會2025中,軟通動力攜手華為云以華為云昇騰AI、盤古大模型、ModelArts等為技術底座,全新升級數據治理基線解決方案,正式發布AI知識引擎與數據工程融合創新解決方案
    的頭像 發表于 06-28 17:07 ?1604次閱讀

    機智云亮相2025春季火山引擎FORCE原動力大會

    在 2025 年字節跳動火山引擎 Force 春季原動力大會上,作為 AIoT 領域的創新先鋒,機智云以火山引擎與扣子智能體核心AI生態合作伙伴身份重磅亮相,憑借基于火山
    的頭像 發表于 06-23 09:16 ?1163次閱讀

    涂鴉智能重磅發布四大AIoT技術引擎,賦能開發者以AI重構物理世界

    正加快推動AIoT技術普惠化進程?,F場,涂鴉分享了AIAgent開發平臺,并重磅發布了Tuya.AI、TuyaOpen和海德薇(HEDV)等技術引擎,賦能開發者全
    的頭像 發表于 05-08 19:07 ?793次閱讀
    涂鴉<b class='flag-5'>智能</b>重磅發布四大AIoT<b class='flag-5'>技術</b><b class='flag-5'>引擎</b>,賦能開發者以<b class='flag-5'>AI</b>重構物理世界

    移遠通信攜手火山引擎:加速AI大模型技術應用,共繪AIoT智能未來新藍圖

    4月2日,移遠通信受邀參加火山引擎聯合英特爾在深圳舉辦的“AIoT智變浪潮”技術沙龍。活動以“大模型+音視頻,如何驅動AI硬件體驗革新”為主題,眾多行業大咖齊聚一堂,圍繞硬件智能升級面
    的頭像 發表于 04-02 19:02 ?1314次閱讀
    移遠通信攜手火山<b class='flag-5'>引擎</b>:加速<b class='flag-5'>AI</b>大模型<b class='flag-5'>技術</b>應用,共繪AIoT<b class='flag-5'>智能</b>未來新藍圖

    ×火山引擎 | 高精度同步時鐘助力字節跳動華東地區首個算力中心落地

    同步時鐘全方位賦能火山引擎長三角算力中心,助力字節跳動火山引擎打造“云上新宇宙”。
    的頭像 發表于 03-31 14:44 ?1114次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>×火山<b class='flag-5'>引擎</b> | 高精度同步時鐘助力字節跳動華東地區首個算力中心落地

    ×字節跳動 高精度同步時鐘助力火山引擎打造“云上新宇宙”

    摘要: 同步時鐘將對火山引擎長三角算力中心進行從基礎設施到業務引擎的全方位賦能,助力字節跳動旗下火山引擎打造“云上新宇宙”。 火山
    的頭像 發表于 03-28 09:11 ?879次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>×字節跳動  高精度同步時鐘助力火山<b class='flag-5'>引擎</b>打造“云上新宇宙”

    ?Diffusion生成式動作引擎技術解析

    Diffusion生成式動作引擎 Diffusion生成式動作引擎是一種基于擴散模型(Diffusion Models)的生成式人工智能技術,專注于生成連續、逼真的人類動作或動畫序列。這類引擎
    的頭像 發表于 03-17 15:14 ?3045次閱讀

    融合30萬項專利,“OptoChat AI引擎引爆萬億光子AI市場

    ? 電子發燒友網報道(文/吳子鵬) 近日,南京江北新區企業 —— 南京南智先進光電集成技術研究院有限公司,聯合南京知滿科技等合作伙伴,成功開發出國內首個光子 AI 智能引擎 “Opto
    的頭像 發表于 03-09 04:38 ?1961次閱讀
    融合30萬項專利,“OptoChat <b class='flag-5'>AI</b>”<b class='flag-5'>引擎</b>引爆萬億光子<b class='flag-5'>AI</b>市場

    CSK6大模型語音開發板接入DeepSeek資料匯總(包含深度求索/火山引擎/硅基流動華為昇騰滿血版)

    本帖最后由 jf_40317719 于 2025-3-6 21:20 編輯 近期也有不少開發者想把自己的智能硬件接入DeepSeek大模型,本篇就以聆CSK6大模型開發板接入DeepSeek
    發表于 03-06 17:02