西班牙的SemiDynamics基于其完全可定制的64位內核開發了用于AI芯片設計的RISC-V Tensor Unit。
RISC-V Tensor 單元集成到緩存子系統中,SemiDynamics 使其成為第一個用于數據中心高性能 AI 芯片設計的完全一致的此類單元。
LLaMa-2 或 ChatGPT 等大型語言機器學習模型 (LLM) 使用數十億個參數,需要大量計算能力。LLM 層中的大部分計算可以作為張量單元硬件中的矩陣乘法有效實現。
張量單元構建在 Semidynamics RVV1.0 矢量處理單元之上,并使用現有的矢量寄存器來存儲矩陣。這使得張量單元可以用于需要矩陣乘法功能的層,例如全連接和卷積,并將向量單元用于激活函數層(ReLU、Sigmoid、Softmax 等),這是一個很大的改進- 單獨的 NPU 可能會與激活層作斗爭。

張量單元使用矢量單元功能以及 Atrevido-423 Gazzillion CPU 從內存中獲取所需的數據。64 位 CPU 內核的性能意味著不需要直接內存訪問 (DMA) 來管理數據流。由于張量單元使用向量寄存器來存儲其數據,并且不包含新的、架構上可見的狀態,因此它可以與任何支持 RISC-V 向量的 Linux 一起使用,而無需進行任何更改。
SemiDynamics 創始人兼首席執行官 Roger Espasa 表示:“這個新的 Tensor Unit 旨在與我們的其他創新技術完全集成,以提供具有出色 AI 性能的解決方案。”
“首先,核心是我們的 64 位完全可定制的 RISC-V 內核。然后是我們的矢量單元,它通過我們的 Gazzillion 技術不斷饋送數據,因此不會丟失任何數據。然后是張量單元,它執行人工智能所需的矩陣乘法。該解決方案的每個階段都經過精心設計,可與其他階段完全集成,以實現最佳的人工智能性能和非常簡單的編程。與僅在標量核心上運行 AI 軟件相比,性能提高了 128 倍。”
Tensor Unit 將于下個月在美國舉行的 RISC-V 峰會上進行討論,作為人工智能芯片設計重點的一部分。
審核編輯:黃飛
-
寄存器
+關注
關注
31文章
5608瀏覽量
130003 -
cpu
+關注
關注
68文章
11279瀏覽量
225033 -
機器學習
+關注
關注
66文章
8553瀏覽量
136964 -
RISC-V
+關注
關注
48文章
2886瀏覽量
53037 -
AI芯片
+關注
關注
17文章
2128瀏覽量
36786
原文標題:RISC-V,進攻AI芯片
文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
奕斯偉計算RISC-V內核R520A斬獲德國萊茵TüV ASIL-D功能安全認證
RISC-V vs ARM:為什么工業與邊緣計算仍然選擇 ARM 架構?
Renesas R9A02G021:32位RISC-V MCU的全方位解析
重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地
RISC-V B擴展介紹及實現
PIC64GX1000 RISC-V MPU:一款面向嵌入式計算的高性能64位多核處理器
成都華微32位RISC-V超低功耗MCU新品發布
RISC-V 手冊
燦芯半導體亮相2025 RISC-V中國峰會
中微愛芯RISC-V內核32位通用MCU AiP32RV1564介紹
HPM5E31IGN單核 32 位 RISC-V 處理器
RISC-V核低功耗MCU指令集架構(ISA)特點
FPGA與RISC-V淺談
DietPi 9.10:帶來 RISC-V 升級與樹莓派內核遷移
基于可定制64位內核的RISC-V設計
評論