伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思分享:智能引擎中所的AI引擎技術(shù)分析

454398 ? 來源:Xilinx技術(shù)社區(qū) ? 作者:Olivier Tremois ? 2020-10-11 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Olivier Tremois(AI 引擎工具市場營銷部門)和 Florent Werbrouck(賽靈思技術(shù)支持產(chǎn)品應(yīng)用工程師

Versal ACAP 簡介

Versal 自適應(yīng)計算加速平臺 (ACAP) 是基于 TSMC 7nm FinFET 工藝技術(shù)構(gòu)建的最新一代賽靈思器件。它利用高帶寬片上網(wǎng)絡(luò) (NoC) 將代表處理器系統(tǒng) (PS) 的標(biāo)量引擎、代表可編程邏輯 (PL) 的自適應(yīng)引擎與智能引擎有機結(jié)合在一起。

本文將著重介紹智能引擎中所包含的 AI 引擎。

賽靈思 AI 引擎簡介

在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內(nèi)存、數(shù)據(jù)流和級聯(lián)接口相連的二維AI 引擎拼塊陣列。在當(dāng)前 ACAP 器件(例如,VC1902 器件)上,此陣列最多可包含 400 個拼塊。此陣列中還包含AI 引擎接口(位于最后一行),以便于陣列中的其它器件(PS、PL 和 NoC)進(jìn)行交互。

AI 引擎接口包含PL 和 NoC 接口拼塊以及配置拼塊。從 PL 到 AI 引擎陣列的連接是使用 AXI4-Stream 接口通過 PL 和 NoC 接口拼塊來實現(xiàn)的。從 NoC 到 AI 引擎陣列的連接是使用 AXI4 存儲器映射接口通過 NoC 接口拼塊來實現(xiàn)的。

有趣的是,從中可以看到,只有在 NoC 到 AI 引擎拼塊之間才存在 AXI4 存儲器映射直接通信通道,在 AI 引擎拼塊到 NoC 之間卻并不存在。

注:PL 和 NoC 接口拼塊的精確數(shù)量因器件而異?!禫ersal 架構(gòu)和產(chǎn)品數(shù)據(jù)手冊:簡介》(DS950) 中羅列了 AI 引擎陣列的大小。
https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-...

AI 引擎拼塊架構(gòu)

現(xiàn)在,我們來詳細(xì)了解下此陣列,看看 AI 引擎拼塊的內(nèi)部。

每個 AI 引擎拼塊都包含:

  • 1 個拼塊互連模塊,用于處理 AXI4-Stream 和存儲器映射 AXI4 輸入/輸出
  • 1 個存儲器模塊,其中包含 32 KB 數(shù)據(jù)內(nèi)存,細(xì)分為 8 個內(nèi)存 bank、1 個內(nèi)存接口、DMA 和各種鎖定。
  • 1 個 AI 引擎

AI 引擎可訪問全部 4 個方向中的多達(dá) 4 個內(nèi)存模塊(作為 1 個連續(xù)存儲器塊)。這意味著除了拼塊本地的內(nèi)存,AI 引擎還可以訪問 3 個相鄰拼塊的本地內(nèi)存(除非拼塊位于陣列邊緣)。

  • 北側(cè)內(nèi)存模塊
  • 南側(cè)內(nèi)存模塊
  • 東側(cè)或西側(cè)內(nèi)存模塊(取決于 AI 引擎和內(nèi)存模塊所在的行和相對布局)。

AI 引擎架構(gòu)

AI 引擎屬于高度優(yōu)化的處理器,包含下列主要特色:

  • 32 位標(biāo)量 RISC 處理器(名為 Scalar Unit)
  • 1 個 512b SIMD 矢量單元(可提供矢量定點/整數(shù)單元)和 1 個單精度浮點 (SPFP) 矢量單元
  • 3 個地址生成器單元 (AGU)
  • 超長指令字 (VLIW) 功能
  • 3 個數(shù)據(jù)內(nèi)存端口(2 個負(fù)載端口,1 個存儲端口)
  • 直接流傳輸接口(2 個輸入流,2 個輸出流)

AI 引擎陣列編程

AI 引擎拼塊按 10 或 100 為單位組成陣列。創(chuàng)建嵌入多項指令的單一程序用于指定并行性將是一項冗長且近乎不可能的任務(wù)。因此 AI 引擎陣列模型編程與 Kahn 處理網(wǎng)絡(luò) (Kahn Process Networks) 之間的共通之處在于自主計算進(jìn)程通過通信邊緣實現(xiàn)彼此互連,從而生成處理網(wǎng)絡(luò)。

(請參閱 https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf )

在 AI 引擎框架中,Graph 邊緣是緩存和數(shù)據(jù)流,而計算進(jìn)程則被稱為內(nèi)核。在Graph中,內(nèi)核經(jīng)過例化,彼此相連并連接到設(shè)計其余部分(NoC 或 PL)。

編程流程分為 2 個階段:

單內(nèi)核編程:

內(nèi)核用于描述特定計算進(jìn)程。每個內(nèi)核都將在單一 AI 引擎拼塊上運行。但請注意,多個內(nèi)核可在同一個 AI 引擎拼塊上運行,并共享處理時間。任意 C/C++ 代碼均可用于對 AI 引擎進(jìn)行編程。標(biāo)量處理器將處理大部分代碼。如果您的目標(biāo)是設(shè)計高性能內(nèi)核,那么應(yīng)考慮采用矢量處理器,它使用稱為內(nèi)部函數(shù)的專用函數(shù)。這些函數(shù)專用于 AI 引擎的矢量處理器,支持您從 AI 引擎中發(fā)掘出巨大的處理性能。賽靈思將提供預(yù)構(gòu)建內(nèi)核(包含在庫內(nèi)),以供用戶在其定制 Graph 中使用。

Graph 編程:

賽靈思將提供 C++ 框架以從內(nèi)核創(chuàng)建Graph。此框架包含 Graph 節(jié)點和連接聲明。這些節(jié)點可包含在 AI 引擎陣列內(nèi)或可編程邏輯(HLS 內(nèi)核)中。為了完全掌握內(nèi)核位置,將有一系列方法可用來約束布局(內(nèi)核、緩存、系統(tǒng)內(nèi)存等)。Graph 將例化并使用緩存和數(shù)據(jù)流將內(nèi)核連接在一起。它還將描述 AI 引擎陣列與其它ACAP 器件(PL 或 DDR)之間的雙向往來數(shù)據(jù)傳輸。

賽靈思將提供預(yù)構(gòu)建 Graph(包含在庫內(nèi)),以供用戶在其應(yīng)用中使用。

在運行時以及仿真期間,AI 引擎應(yīng)用由 PS 進(jìn)行控制。

賽靈思將根據(jù)應(yīng)用的操作系統(tǒng)提供多種 API,如下所述。

  • Xilinx Run Time (XRT) 和 OpenCL,適用于 Linux 應(yīng)用
  • 裸機驅(qū)動程序

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    33

    文章

    1798

    瀏覽量

    133588
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40578

    瀏覽量

    302210
  • 可編程邏輯
    +關(guān)注

    關(guān)注

    7

    文章

    528

    瀏覽量

    45446
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    智造引擎,仿真之巔:Altair HyperWorks 重塑工程研發(fā)新格局?

    等極端工況分析;· HyperForm:金屬板材成型仿真專家,優(yōu)化沖壓工藝、減少缺陷;· 更有流體、熱、電磁、聲學(xué)等多物理場模塊,以及 AI 仿真、高性能計算(HPC)等前沿技術(shù)加持。從概念設(shè)計草圖到
    發(fā)表于 04-03 14:45

    FPGA電源解決方案全解析

    FPGA電源解決方案全解析 在當(dāng)今的電子設(shè)計領(lǐng)域,現(xiàn)場可編程門陣列(FPGA)憑借其出色的設(shè)計靈活性和較低的工程成本,在眾多應(yīng)用和終端市場中占據(jù)了重要地位。然而,F(xiàn)PGA的電源設(shè)計和管理卻是一
    的頭像 發(fā)表于 04-02 15:45 ?67次閱讀

    為什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神經(jīng)網(wǎng)絡(luò)引擎?

    我想知道為什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神經(jīng)網(wǎng)絡(luò)引擎,請問?您能否舉一些關(guān)于他們的用例的例子?
    發(fā)表于 03-25 06:01

    光學(xué)引擎奧特智能視覺光源如何賦能工業(yè)4.0質(zhì)檢新紀(jì)元

    智能制造飛速發(fā)展的浪潮中,機器視覺檢測技術(shù)正以前所未有的速度重塑著現(xiàn)代工業(yè)的質(zhì)量控制體系。作為視覺系統(tǒng)的"光學(xué)引擎",高性能視覺光源以其卓越的均勻性和智能化特性,正在成為推動工業(yè)質(zhì)檢
    的頭像 發(fā)表于 02-24 17:53 ?973次閱讀

    易百納攜多模態(tài)AI桌面機器人——Kubee Robot亮相2025火山引擎冬季FORCE大會

    的 Kubee Robot AI 桌面機器人亮相,該產(chǎn)品搭載海 AI 主控與星閃技術(shù),以 HongOU Lite 模組為內(nèi)核,深度融合豆包大模型能力,實現(xiàn)多模態(tài)
    的頭像 發(fā)表于 12-27 11:30 ?172次閱讀
    易百納攜多模態(tài)<b class='flag-5'>AI</b>桌面機器人——Kubee Robot亮相2025火山<b class='flag-5'>引擎</b>冬季FORCE大會

    必馳場景化推理AI重塑智能交互

    AI技術(shù)從“感知”走向“認(rèn)知”的今天,推理能力正成為推動人工智能向更高階躍遷的核心引擎。
    的頭像 發(fā)表于 12-12 11:31 ?798次閱讀

    帶寬7.2Tb/s!海光電推出HI-ONE硅光引擎

    電子發(fā)燒友網(wǎng)綜合報道 在最近,海光電發(fā)布了其全新的HI-ONE硅光引擎,這是基于其III-V光芯片、硅基半導(dǎo)體芯片技術(shù)和先進(jìn)光電封裝平臺能力,面向AI時代的高密度光電互連推出的新一代
    的頭像 發(fā)表于 10-27 06:50 ?6068次閱讀

    光庭信息亮相2025上海虛幻引擎技術(shù)開放日

    專家與前沿科技企業(yè),共同解鎖虛幻引擎(UE)技術(shù)的未來邊界。光庭信息智能座艙事業(yè)部技術(shù)總監(jiān)陳治在汽車峰會專場發(fā)表《虛幻引擎助力3D
    的頭像 發(fā)表于 08-28 15:30 ?1383次閱讀

    特威第二屆機器視覺大會即將舉辦

    去年盛夏,首屆易特威機器視覺技術(shù)大會點燃了行業(yè)創(chuàng)新的火花。易驚艷亮相的 TJ375
    的頭像 發(fā)表于 08-13 09:53 ?1445次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢
    發(fā)表于 07-16 15:29

    軟通動力攜手華為云推出AI知識引擎與數(shù)據(jù)工程融合創(chuàng)新解決方案

    在華為開發(fā)者大會2025中,軟通動力攜手華為云以華為云昇騰AI、盤古大模型、ModelArts等為技術(shù)底座,全新升級數(shù)據(jù)治理基線解決方案,正式發(fā)布AI知識引擎與數(shù)據(jù)工程融合創(chuàng)新解決方案
    的頭像 發(fā)表于 06-28 17:07 ?1703次閱讀

    機智云亮相2025春季火山引擎FORCE原動力大會

    在 2025 年字節(jié)跳動火山引擎 Force 春季原動力大會上,作為 AIoT 領(lǐng)域的創(chuàng)新先鋒,機智云以火山引擎與扣子智能體核心AI生態(tài)合作伙伴身份重磅亮相,憑借基于火山
    的頭像 發(fā)表于 06-23 09:16 ?1245次閱讀

    廣和通出席2025春季火山引擎FORCE原動力大會

    景的AI交互能力。大會聚焦大模型、云原生、智能應(yīng)用等前沿議題,吸引了來自人工智能、云計算和應(yīng)用開發(fā)等領(lǐng)域的大量開發(fā)者、技術(shù)專家及生態(tài)伙伴,共話AI
    的頭像 發(fā)表于 06-17 09:17 ?1162次閱讀

    涂鴉智能重磅發(fā)布四大AIoT技術(shù)引擎,賦能開發(fā)者以AI重構(gòu)物理世界

    正加快推動AIoT技術(shù)普惠化進(jìn)程。現(xiàn)場,涂鴉分享了AIAgent開發(fā)平臺,并重磅發(fā)布了Tuya.AI、TuyaOpen和海德薇(HEDV)等技術(shù)引擎,賦能開發(fā)者全
    的頭像 發(fā)表于 05-08 19:07 ?866次閱讀
    涂鴉<b class='flag-5'>智能</b>重磅發(fā)布四大AIoT<b class='flag-5'>技術(shù)</b><b class='flag-5'>引擎</b>,賦能開發(fā)者以<b class='flag-5'>AI</b>重構(gòu)物理世界

    如何基于Kahn處理網(wǎng)絡(luò)定義AI引擎圖形編程模型

    本白皮書探討了如何基于 Kahn 處理網(wǎng)絡(luò)( KPN )定義 AI 引擎圖形編程模型。KPN 模型有助于實現(xiàn)數(shù)據(jù)流并行化,進(jìn)而提高系統(tǒng)的整體性能。
    的頭像 發(fā)表于 04-17 11:31 ?931次閱讀
    如何基于Kahn處理網(wǎng)絡(luò)定義<b class='flag-5'>AI</b><b class='flag-5'>引擎</b>圖形編程模型