一文解析Numenta加速AI推理的的秘密

Numenta近期引起了廣泛關注，聲稱可以有效地管理CPU上的數據，實現了驚人的性能數據。與其他人工智能推理數據不同的是，Numenta并不需要大量的資源。Numenta采用了Intel AMX和AVX-512等功能，結合管理稀疏性的軟件，以加速AI推理的過程。

英特爾總結了這一解決方案，Numenta在使用其定制指令進行人工智能推理。 Numenta成立于2005年，由Jeff Hawkins和Donna Dubinsky創立，公司的目標是將更多的大腦工作方式應用于人工智能問題。提出的方法受到了神經科學的啟發，尤其是大腦中稀疏計算的特性。

神經元的結構異常復雜，大腦的工作方式卻處于極度稀疏的狀態。生物大腦的學習過程是動態而稀疏的，其中神經元之間的連接是稀疏的，激活和信號傳遞也是稀疏的。大腦還善于利用上下文信息進行路由。當外部輸入信號進入大腦時，大腦會智能地識別相關的高度稀疏的神經元部分，并根據輸入信號和周圍環境進行信息傳遞。在當前的人工智能領域，大多數組織更傾向于使用高度密集的計算方法。CPU 和 GPU 專為密集矩陣乘法計算而設計，具有相對深的管道、高時鐘速度和大矢量引擎，需要暫存數據來填充這些計算資源。稀疏性旨在提供相反的、更少的計算數據。

幾年前，Numenta與Xilinx進行了合作，展示了在吞吐量、延遲和電源效率方面實現了兩個數量級的提高，同時保持了相似的精度。正將其算法應用到新的CPU硬件中。Numenta的研究表明，可以實現超高稀疏性，去除了90%的權重，同時保持了相似的精度水平。Numenta 分享了使用 AVX-512 和 1024×1024 數據矩陣優化的英特爾數學內核庫 (MKL)。這里CSR（壓縮稀疏行）是非結構化稀疏性，BSR是塊結構稀疏性。

將AVX-512和AMX結合使用，實現硬件幾乎全速運行，避免了需要高度稀疏性才能獲得加速的情況。已經在Intel Xeon MAX CPU上得到了應用，并且在內存帶寬受限的大型模型上，實現了高達3倍的吞吐量改進。?

Numenta 采用了 NVIDIA 報告的 A100 性能數據的工作負載，并在 AWS 上的雙插槽 48 核 Sapphire Rapids 服務器上運行。可以線性擴展至 48 個核心，客戶端都運行自己的 BERT-Large 實例，因此會給緩存和內存子系統帶來壓力。

Numenta的方法突破了現代CPU和GPU面臨的稀疏性挑戰。與使用有限資源的NVIDIA GPU、尚未發布的AMD GPU、Intel Gaudi2等加速器不同，Numenta的解決方案在標準服務器上運行，這在業界引起了極大的興奮。

Numenta 通過可擴展且安全的 LLM 服務將該解決方案產品化，用于情感分析、摘要、問答、文檔分類、內容創建和代碼生成等（ NuPIC 或 Numenta 智能計算平臺）。人工智能領域實現準確性的同時，降低了成本，可能是一條可行的路徑。

編輯：黃飛

閱讀全文

英特爾(179675) 英特爾(179675)
cpu(223573) cpu(223573)
NVIDIA(109324) NVIDIA(109324)
gpu(134654) gpu(134654)
AI(298911) AI(298911)

安富利：FPGA加速AI推理加速成功應用案例

的AI應用需要經歷訓練和推理兩個過程。所謂訓練，就是我們要將大量的數據代入到神經網絡模型中運算并反復迭代，教會算法模型如何正確的工作，訓練出一個DL模型。而接下來，我們就可以利用訓練出來的模型來在線響應用戶的需求，根據

2020-09-29 10:43:32

5536

谷歌第七代TPU Ironwood深度解讀：AI推理時代的硬件革命

谷歌第七代TPU Ironwood深度解讀：AI推理時代的硬件革命 Google 發布了 Ironwood，這是其第七代張量處理單元（TPU），專為推理而設計。這款功能強大的 AI 加速器旨在處理

2025-04-12 11:10:01

3280

高通推出其首款基于云端的AI加速器：Qualcomm Cloud AI 100，正式宣布進軍云計算領域

本月，高通推出其首款基于云端的 AI 加速器：Qualcomm Cloud AI 100，正式宣布進軍云計算領域。根據高通的說法，Qualcomm Cloud AI 100 是一款用于數據中心的 AI 推理處理器。

2019-04-29 17:46:59

6250

Arm推動生成式AI落地邊緣！全新Ethos-U85 AI加速器支持Transformer 架構，性能提升四倍

電子發燒友網報道（文/黃晶晶）在嵌入式領域，邊緣與端側AI推理需求不斷增長，Arm既有Helium 技術使 CPU 能夠執行更多計算密集型的 AI 推理算法，也有Ethos 系列 AI 加速器，以

2024-04-16 09:10:17

6146

AI推理帶火的ASIC，開發成敗在此一舉！

電子發燒友網報道（文/梁浩斌）去年年底，多家大廠爆出開發數據中心ASIC芯片的消息，包括傳聞蘋果與博通合作開發面向AI推理的ASIC，亞馬遜也在年底公布了其AI?ASIC的應用實例，展示出ASIC

2025-03-03 00:13:00

4388

谷歌新一代 TPU 芯片 Ironwood：助力大規模思考與推理的 AI 模型新引擎?

電子發燒友網報道（文 / 李彎彎）日前，谷歌在 Cloud Next 大會上，隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據悉，該芯片預計于今年晚些時候面向 Google

2025-04-12 00:57:00

3397

AI推理芯片賽道猛將，200億市值AI芯片企業赴港IPO

設計及商業化。公司推出了面向企業級、消費級、行業級三大類應用場景的行業領先的NPU驅動AI推理芯片相關產品及服務，成功打造了從AI推理基礎設施構建到產品設計、開發及商業化落地的完整閉環，實現了AI在多元場景的快速遷移。 ? ? 2024年營收超9億元，消費級場景加速

2025-08-04 09:22:55

4335

今日看點丨華為發布AI推理創新技術UCM；比亞迪汽車出口暴增130%

? ? 降低HBM依賴，華為發布AI推理創新技術UCM ? 日前，華為正式發布AI推理創新技術UCM（推理記憶數據管理器）。據了解，作為一款以KV Cache為中心的推理加速套件，UCM融合了多類型

2025-08-13 09:45:46

4115

算力密度翻倍！江原D20加速卡發布，一卡雙芯重構AI推理標桿

電子發燒友網報道（文/莫婷婷）隨著AI技術迅猛發展，大模型的參數規模已突破千億級別，AI推理需求呈現出爆發式增長。然而，在大模型加速落地的浪潮中，高效、穩定且安全的推理能力日益凸顯為制約產業發展

2025-11-14 08:21:00

9924

算力積木+3D堆疊！GPNPU架構創新，應對AI推理需求

電子發燒友網報道（文/李彎彎）2025年，人工智能正式邁入應用推理時代。大模型從實驗室走向千行百業，推理需求呈指數級爆發。然而，高昂的推理成本與有限的算力供給之間的矛盾日益凸顯，成為制約AI規模化

2025-12-11 08:57:00

7493

ai加速芯片

ai加速芯片，申耀的科技觀察讀懂科技，贏取未來！毫無疑問，以大數據分析、云計算、人工智能等新技術所推動的數字化轉型正迅速的改變著我們所處的時代，其巨大的影響力已經從量變上升為質變，可以說數字化轉型已成...

2021-07-28 07:53:56

一文了解Mojo編程語言

CPU、GPU 和其他加速器的支持，簡化了并行編程模型。漸進式類型系統結合靜態類型檢查和類型推導，既保證編譯時安全性，又保留動態類型的靈活性。應用場景 AI 與機器學習用于訓練大型模型和實時推理

2025-11-07 05:59:01

Dllite_micro （輕量級的 AI 推理框架）

DLLite-Micro 是一個輕量級的 AI 推理框架，可以為 OpenHarmony OS 的輕量設備和小型設備提供深度模型的推理能力DLLite-Micro 向開發者提供清晰、易上手的北向接口

2021-08-05 11:40:11

HarmonyOS：使用MindSpore Lite引擎進行模型推理

場景介紹 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件設備 AI 模型推理的功能，目前已經在圖像分類、目標識別、人臉識別、文字識別等應用中廣泛使用。本文介紹

2023-12-14 11:41:13

NVIDIA 在首個AI推理基準測試中大放異彩

首個獨立AI推理基準測試 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市場中最大、同時也是最具競爭力的領域，業內此前一直希望能夠有一套客觀的推理性能測試指標。在參與

2019-11-08 19:44:51

《 AI加速器架構設計與實現》+第2章的閱讀概括

首先感謝電子發燒友論壇提供的書籍和閱讀評測的機會。拿到書，先看一下封面介紹。這本書的中文名是《AI加速器架構設計與實現》，英文名是Accelerator Based on CNN Design

2023-09-17 16:39:45

【HarmonyOS HiSpark AI Camera】AI圖像開發

項目名稱：AI圖像開發試用計劃：申請理由本人在AI圖像識別中已有一年的開發經驗,目前正采用瑞芯微的rk1808芯片進行模型的落地部署，但是該芯片沒有任何的攝像頭方案，需要自己選取。目前選取的攝像頭在

2020-09-25 10:11:50

【KV260視覺入門套件試用體驗】Vitis-AI加速的YOLOX視頻目標檢測示例體驗和原理解析

會對關鍵源碼進行解析。一、Vitis AI Library簡介上一篇帖子中，我們了解了Vitis統一軟件平臺和Vitis AI，并體驗了Vitis AI Runtime的Resnet50圖像分類示例

2023-10-06 23:32:47

信而泰×DeepSeek：AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

模態的技術特性，DeepSeek正加速推動AI在金融、政務、科研及網絡智能化等關鍵領域的深度應用。信而泰：AI推理引擎賦能網絡智能診斷新范式信而泰深度整合DeepSeek-R1大模型系統，構建了新一

2025-07-16 15:29:20

先進的創新教育：AI 思維+設計思維

，機器的學習成效都遠遠超越人類了。機器所具有的AI智能是它自己學習來的，又能迅速精通。然而從另一方面來看，機器的邏輯能力卻一直無法超越人類。回顧一下AI的發展歷史，自從1950年代，許多專家們就是希望將

2021-01-04 10:16:36

壓縮模型會加速推理嗎？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡單的 CNN 導入到 STM32L462RCT我發現壓縮模型對推理時間沒有影響。aiRun 程序在 8

2023-01-29 06:24:08

嘉楠勘智K510開發板簡介——高精度AI邊緣推理芯片及應用

。K510是嘉楠公司推出的第二代AI加速芯片，它采用雙核RISC-V CPU@800Mhz,內置DSP協處理器和強大的AI運算單元KPU，支持 BF16浮點數據格式，可在邊緣端進行高精度推理，是國內少有

2022-11-22 15:52:15

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

大模型推理顯存和計算量估計方法研究

隨著人工智能技術的飛速發展，深度學習大模型在各個領域得到了廣泛應用。然而，大模型的推理過程對顯存和計算資源的需求較高，給實際應用帶來了挑戰。為了解決這一問題，本文將探討大模型推理顯存和計算量的估計

2025-07-03 19:43:59

如何加速電信領域AI開發？

在即將開展的“中國移動全球合作伙伴大會”上，華為將發布一款面向運營商電信領域的一站式AI開發平臺——SoftCOM AI平臺，幫助電信領域開發者解決AI開發在數據準備、模型訓練、模型發布以及部署驗證

2021-02-25 06:53:41

如何在RK3399上搭建Tengine AI推理框架呢

Tengine是什么？如何在RK3399這一 Arm64 平臺上搭建 Tengine AI 推理框架，并運行圖像識別相關應用？

2022-03-07 07:53:43

如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢

Tengine是什么呢？如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢？

2022-03-04 12:31:35

嵌入式邊緣AI應用開發指南

步保駕護航。下面讓我們來了解如何不借助手動工具或手動編程來選擇模型、隨時隨地訓練模型并將其無縫部署到TI處理器上，從而實現硬件加速推理。圖1：邊緣AI應用的開發流程第1步：選擇模型邊緣AI系統開發

2022-11-03 06:53:28

開發者手機 AI - 目標識別 demo

Network Runtime 神經網絡運行時，作為中間橋梁連通上層AI推理框架和底層加速芯片，實現AI模型的跨芯片推理計算。提供統一AI芯片驅動接口，使AI芯片驅動能夠接入OpenHarmony系統

2024-04-11 16:14:55

當AI遇上FPGA會產生怎樣的反應

一旦被訓練完成，線上推理的效率才決定用戶體驗。比如，有2個同樣AI模型的訓練，一家公司用了1天訓練完成，但線上推理的效率只有每秒100個任務；另一家公司用了7天訓練完成，但線上推理效率可以達到每秒

2021-09-17 17:08:32

深度剖析OpenHarmony AI調度管理與推理接口

1 簡介AI任務管理與統一的推理能力提供了接口的統一標準系統上CPU提供了AI任務調度管理的能力，對AI的能力進行了開放的推理和推理，同時，提供了一個不同的生命周期框架層級的應用程序。推理接口

2022-03-25 11:15:36

深度學習推理和計算-通用AI核心

商業發行之前就已經過時了。算法明天需要對架構、內存/數據進行徹底改革資源和能力。推理的夢幻建筑重新定義重寫在計算和交付突破性的人工智能加速和靈活的計算能力超越了服務器級CPU和比GPU/ASIC通用

2020-11-01 09:28:57

芯研通AIC-200人工智能推理加速卡

產品簡介AIC-200是芯研通基于華為ATLAS 200 AI加速處理模塊推出的人工智能推理加速卡，內部集成2顆ATLAS 200加速模塊，可提供高達44TOPS INT8算力。AIC-200采用

2022-03-29 11:30:56

尤里云UNIXCLOUD推理運算加速模塊UXC2200

堆疊構建AI計算集群。4核ARMv8 64bit CPU@2.4GHz4個基于ManyCore計算架構的異構運算加速簇, 12.8TOPS@INT818GB LPD

2022-11-17 14:03:31

尤里云科技推理運算加速卡UXC2000

尤里云科技推理運算加速卡UXC2000內置TF16110高性能異構處理器及大容量內存，兼容各類標準外擴式機架服務器，可直接提供業務層級的軟件交互接口。12.8TOPS@INT818GB

2022-11-17 14:05:09

華頡高性價比AI推理服務器HS1208G1

產品簡介AI推理服務器HS1208G1HS1208G1是華頡科技推出的一款支持單張全長全高雙寬GPU的高性價比AI推理服務器，基于Intel企業級C246芯片組，可搭載Intel Xeon

2025-03-31 15:54:03

一文看懂AI算法的秘密

這篇文章的主角是 AlphaGo ，谷歌DeepMind團隊開發出的圍棋AI 。其憑借著2016年擊敗全球頂尖棋手李世石的壯舉而廣受矚目。下面就隨網絡通信小編一起來了解一下相關內容吧。圍棋是一

2018-03-25 10:03:00

11621

一文解析PLC的應用

一文解析PLC的應用，具體的跟隨小編一起來了解一下。

2018-07-19 11:21:56

6117

芯文芯事丨瑞薩e-AI加速“實時”和“安全”，實現智能工廠

2019-07-02 14:11:52

2529

NVIDIA推出一款突破性的推理軟件可以實現會話式AI應用

2019年12月18日— — NVIDIA于今日發布一款突破性的推理軟件。借助于該軟件，全球各地的開發者都可以實現會話式AI應用，大幅減少推理延遲。而此前，巨大的推理延遲一直都是實現真正交互式互動的一大阻礙。

2019-12-19 10:06:51

1571

英偉達發布一款推理軟件助力實現會話式AI應用

英偉達發布了一款突破性的推理軟件，借助于這款軟件，全球各地的開發者都可以實現會話式AI應用，大幅減少推理延遲。而此前，巨大的推理延遲一直都是實現真正交互式互動的一大阻礙。

2020-02-03 15:51:48

829

NVIDIA GPU加速AI推理洞察，推動跨行業創新

的TensorRT推理引擎及其用于深度學習的CUDA/ cuDNN加速庫，以及用于Jetson模塊的NVIDIAJetPack工具套件。

2020-07-02 15:00:54

2470

一文詳談AI邊緣推理與數據中心的差異和應用

雖然推理加速器最初用于數據中心，但它們已經迅速發展到應用程序的邊緣推理，如自動駕駛和醫學成像。通過這種轉變，客戶發現，同樣的加速器，在數據中心處理圖像很順利，但移到邊緣推斷方面卻顯得糟糕。其實原因很簡單：一個處理數據池，而另一個處理的是數據流。

2020-09-19 11:31:44

2334

衛星首次具備硬件加速AI推理能力？只因英特爾研發PhiSat-1

9月2日，歐洲航天局發射了46顆大小與臺式機相當的實驗衛星，其中一顆名為“PhiSat-1”的實驗衛星搭載了新款高光譜熱像儀，具備機載AI處理能力——衛星具備硬件加速AI推理能力，這還是第一次。

2020-10-22 09:46:13

1954

無縫替代GPU，讓FPGA來加速你的AI推理

的 AI 應用需要經歷訓練和推理兩個過程。所謂“訓練”，就是我們要將大量的數據代入到神經網絡模型中運算并反復迭代，“教會”算法模型如何正確的工作，訓練出一個 DL 模型。而接下來，我們就可以利用訓練出來的模型來在線響應用戶的

2020-10-30 12:17:37

854

英偉達-阿里云異構計算 TensorRT加速AI推理Hackathon 2021 邀請信

為了讓更多的工程師迅速掌握這個高性能的加速工具，英偉達將聯合生態合作伙伴，面向全國開發者們發起TensorRT加速AI推理hackathon 2021大賽。

2021-03-21 10:04:22

3462

設計一個高效的MCU AI工具鏈實現嵌入式AI推理

如今在嵌入式開發領域，如何實現嵌入式AI推理是一個熱門話題。其中，如何在低算力、低功耗、低成本的MCU上部署AI應用，是開發者普遍面臨的一個設計“痛點”。在硬件方面，MCU自身性能的局限性限制了

2021-06-06 18:05:46

3354

Ampere收購OnSpecta，加速對云原生應用程序的AI推理

據 IDC 研究顯示，到 2024 年，AI 服務器市場市值預計將超 260 億美元，年增長率將達 13.7%。在中心和邊緣的基礎架構中，Ampere 的客戶正在尋找解決方案，以管理 AI 推理任務成本和不斷增長的需求。

2021-08-05 15:36:41

978

游戲AI對自對弈推理速度提出新要求

騰訊一直積極地推動強化學習在游戲AI領域的發展，并在2019年推出了“開悟”AI開放研究平臺，提供不同游戲的訓練場景、支撐AI進行強化訓練的大規模算力、統一的強化學習框架以加速研發速度、通用的訓練

2021-10-22 09:23:24

2251

NVIDIA宣布其AI推理平臺的重大更新

軟件的新功能，該軟件為所有AI模型和框架提供跨平臺推理；同時也包含對NVIDIA TensorRT的更新，該軟件優化AI模型并為NVIDIA GPU上的高性能推理提供運行時優化。 NVIDIA還推出了NVIDIA A2 Tensor Core GPU，這是一款用于邊

2021-11-12 14:42:53

2690

燧原科技發布業內帶寬最大的云端AI推理卡“云燧i20”

自第一代云端AI推理加速卡“云燧i10”發布后，燧原科技在構建原始創新的通用算力和自主生態上付出了卓絕的努力。

2021-12-07 15:29:23

933

燧原科技全新一代“邃思”云端AI推理芯片幫助客戶進行云端系統部署

2021年12月，燧原科技重磅發布第二代云端人工智能推理加速卡“云燧i20”——這是時隔僅五個月，繼今年7月發布云端人工智能訓練加速卡“云燧T20”之后，燧原科技又推出的全新一代針對云端推理場景的AI加速產品。

2021-12-09 15:16:17

2577

匹敵7nm GPU，燧原科技第二代云端AI推理卡發布，落地服務器、身份識別、車路協同等應用

i20”，這是時隔僅五個月，繼今年7月發布云端人工智能訓練加速卡“云燧T20”之后，燧原科技又推出的全新一代針對云端推理場景的AI加速產品。 ? 燧原科技CEO趙立東和COO張亞林發布第二代云端AI推理產品 ? 燧原科技CEO趙立東在發布會上表示，我們的

2021-12-09 13:12:00

6363

使用Clara Holoscan加速AI推理和圖形可視化

　　NVIDIA Clara Holoscan 為開發人員提供了一個可擴展的醫療設備計算平臺，以創建人工智能微服務并實時提供見解。該平臺優化了數據管道的每個階段：從高帶寬數據流和基于物理的分析到加速 AI 推理和圖形可視化。

2022-04-15 14:45:29

1833

利用NVIDIA Triton推理服務器加速語音識別的速度

網易互娛 AI Lab 的研發人員，基于 Wenet 語音識別工具進行優化和創新，利用 NVIDIA Triton 推理服務器的 GPU Batch Inference 機制加速了語音識別的速度，并且降低了成本。

2022-05-13 10:40:19

2805

加速邊緣設備中計算機視覺和語音的AI推理模型

　　SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器，為邊緣設備中的計算機視覺和語音提供更快、更高效的計算能力。

2022-05-31 10:47:55

1432

如何對推理加速器進行基準測試

　　客戶對基準推理學習曲線的最后階段是開發自己的模型，使用通常來自 Nvidia 或數據中心的訓練硬件/軟件，然后在可能的目標推理加速器上對該模型進行基準測試。

2022-06-06 16:02:21

1935

MLPerf是邊緣AI推理的新行業基準

　　最新的 AI 推理基準顯然具有重要意義，因為它是目前可用的最接近真實世界 AI 推理性能的衡量標準。但隨著它的成熟和吸引更多的提交，它也將成為成功部署技術堆棧的晴雨表和新實施的試驗場。

2022-07-08 15:37:55

2384

加速邊緣設備中計算機視覺和語音的AI推理模型

　　SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器，為邊緣設備中的計算機視覺和語音提供更快、更高效的計算能力。RISC-V 處理器的高靈活性和強大功能使客戶能夠以比傳統技術更簡單和更快的速度創建智能城市、智能零售和汽車等復雜的人工智能應用程序。

2022-07-11 11:07:06

1210

用基于SRAM的測試芯片實現加速AI推理

瑞薩電子開發了一種新的內存處理器 (PIM) 技術，用于在低功耗邊緣設備中加速 AI 推理。用于基于 SRAM 技術的測試芯片實現了 8.8 TOPS/W 的運行卷積神經網絡 (CNN) 工作負載

2022-07-21 15:50:32

2009

用于 AI 應用的硬件加速器設計師指南

當 AI 設計人員將硬件加速器整合到用于訓練和推理應用的定制芯片中時，應考慮以下四個因素

2022-08-19 11:35:55

2386

邊緣設備中計算機視覺和語音的AI推理加速器應用

　　SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器，為邊緣設備中的計算機視覺和語音提供更快、更高效的計算能力。

2022-08-16 11:24:05

1689

騰訊云與NVIDIA仍持續為AI推理加速進行合作

騰訊云計算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個 AI 組件。基于 GPU 異構計算平臺針對業界 AI 訓練和推理任務進行了全方位的加速優化。TACO

2022-08-31 09:24:07

2284

Untether AI引領通用AI推理加速器市場

一方面，有廣泛使用的基于CPU和GPU的解決方案。另一方面，許多推理處理器通常專門作為視覺處理器。

2022-08-31 09:42:34

2595

螞蟻鏈AIoT團隊與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團隊與 NVIDIA 合作，將量化感知訓練(QAT)技術應用于深度學習模型性能優化中，并通過 NVIDIA TensorRT 高性能推理 SDK 進行高效率部署，通過 INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權 AI 平臺中的模型推理服務大幅降本增效。

2022-09-09 09:53:52

1845

加速邊緣設備中計算機視覺和語音的AI推理模型

　　加速AI推理模型已成為一項基本任務，因為我們正朝著創建更復雜，更高效的AI應用程序邁進。靈活和完整的AI輔助是在快速增長的AI領域取得成功的關鍵組成部分。

2022-10-19 09:08:50

1015

基于AdderNet的深度學習推理加速器

電子發燒友網站提供《基于AdderNet的深度學習推理加速器.zip》資料免費下載

2022-10-31 11:12:28

研華VEGA-300系列助于加速計算機視覺和邊緣深度學習推理

研華自從發布VEGA-300系列以來，產品引起良好市場反響。截至2022年，產品性能已較前一代產品提升10倍，可提供強大的圖形圖像計算能力。用戶可通過搭配Edge AI Suite軟件工具包，輕松地將VEGA AI加速模塊集成到現有嵌入式板卡和系統中，進行AI推理。

2022-11-01 15:51:08

1497

在 NGC 上玩轉新一代推理部署工具 FastDeploy，幾行代碼搞定 AI 部署

行體驗 FastDeploy！全場景高性能 AI 部署工具 FastDeploy 人工智能技術在各行各業正加速應用落地。為了向開發者提供產業實踐推理部署最優解，百度飛槳發起了

2022-12-13 19:50:05

2193

X3派AI算法推理快速入門

低門檻玩轉X3派AI算法推理

2022-07-18 14:24:30

1698

NIO的自動駕駛AI推理工作流

自動駕駛的最優 AI 推理流水線設計

2023-07-05 16:30:41

1504

AI推理平臺EaiServer(webServer)

AI推理平臺是一種基于人工智能技術的視頻分析工具，可以通過分析視頻內容，提取其中的關鍵信息，從而幫助用戶實現自動化的視頻處理和管理。這種系統通常包括視頻識別、內容分類、目標檢測、場景分析、行為識別等

2023-05-22 15:53:55

3789

主流大模型推理框架盤點解析

vLLM是一個開源的大模型推理加速框架，通過PagedAttention高效地管理attention中緩存的張量，實現了比HuggingFace Transformers高14-24倍的吞吐量。

2023-10-10 15:09:58

7490

介紹一款基于昆侖芯AI加速卡的高效模型推理部署框架

昆侖芯科技公眾號全新欄目“用芯指南”重磅推出！面向AI行業技術從業者，系列好文將提供手把手的昆侖芯產品使用指南。第一期圍繞昆侖芯自研效能工具——昆侖芯Anyinfer展開，這是一款基于昆侖芯AI加速卡的高效模型推理部署框架。種種行業痛點，昆侖芯Anyinfer輕松搞定。

2023-10-17 11:16:43

3136

周四研討會預告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會，將幫助您了解 NVIDIA 開源大型語言模型（LLM）推理加速庫 TensorRT-LLM ?及其功能

2023-10-26 09:05:02

684

瞬變對AI加速卡供電的影響

圖形處理單元（GPU）、張量處理單元（TPU）和其他類型的專用集成電路（ASIC）通過提供并行處理能力來實現高性能計算，以滿足加速人工智能（AI）訓練和推理工作負載的需求。

2023-11-16 17:23:58

1826

使用NVIDIA Triton推理服務器來加速AI預測

這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

2024-02-29 14:04:40

1458

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

2024-05-27 11:50:10

1046

AI初創公司Cerebras秘密申請IPO

近日，全球科技圈再次掀起波瀾。據外媒最新報道，被譽為明星AI芯片獨角獸的Cerebras Systems，已經悄然向證券監管機構遞交了首次公開募股（IPO）的秘密申請。這一動作無疑為當前火爆的AI芯片市場再添一把火。

2024-06-27 17:44:20

1251

LLM大模型推理加速的關鍵技術

LLM（大型語言模型）大模型推理加速是當前人工智能領域的一個研究熱點，旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型推理加速關鍵技術的詳細探討，內容將涵蓋模型壓縮、解碼方法優化、底層優化、分布式并行推理以及特定框架和工具的應用等方面。

2024-07-24 11:38:19

3037

AMD助力HyperAccel開發全新AI推理服務器

提高成本效率。HyperAccel 針對新興的生成式 AI 應用提供超級加速的芯片 IP/解決方案。HyperAccel 已經打造出一個快速、高效且低成本的推理系統，加速了基于轉換器的大型語言模型

2024-09-18 09:37:26

1202

NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise，為企業和科研機構提供了一套高效、靈活的 AI 訓練與推理加速解決方案。無論是在復雜的 AI 開發任務中，還是在高并發推理場景下，都能夠確保項目的順利進行，并顯著提升業務效率與創新能力。

2024-10-27 10:03:25

1765

FPGA和ASIC在大模型推理加速中的應用

隨著現在AI的快速發展，使用FPGA和ASIC進行推理加速的研究也越來越多，從目前的市場來說，有些公司已經有了專門做推理的ASIC，像Groq的LPU，專門針對大語言模型的推理做了優化，因此相比GPU這種通過計算平臺，功耗更低、延遲更小，但應用場景比較單一，在圖像/視頻方向就沒有優勢了。

2024-10-29 14:12:01

2772

一文解析NVIDIA AI-RAN部署平臺

生成式 AI 和 AI 智能體推理將推動 AI 計算基礎設施從邊緣云向中心云分布的需求。IDC 預測“到 2030 年，商業 AI（不包括消費者）將為全球經濟貢獻 19.9 萬億美元，并且占到 GDP 的 3.5%。”

2024-11-19 14:57:03

3525

生成式AI推理技術、市場與未來

（reasoning）能力，這一轉變將極大推動上層應用的發展。紅杉資本近期指出，在可預見的未來，邏輯推理和推理時計算將是一個重要主題，并開啟生成式AI的下一階段。新一輪競賽已然開始。那么，在推理這一

2025-01-20 11:16:36

1338

使用NVIDIA推理平臺提高AI推理性能

NVIDIA推理平臺提高了 AI 推理性能，為零售、電信等行業節省了數百萬美元。

2025-02-08 09:59:03

1512

一文解析工業互聯網

電子發燒友網站提供《一文解析工業互聯網.pptx》資料免費下載

2025-02-20 16:42:51

Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

——Oracle 和 NVIDIA 今日宣布，NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首次實現集成，以幫助全球企業組織加速創建代理式 AI 應用。 ? 此次

2025-03-19 15:24:36

504

英偉達GTC25亮點：NVIDIA Dynamo開源庫加速并擴展AI推理模型

Triton 推理服務器的后續產品，NVIDIA Dynamo 是一款全新的 AI 推理服務軟件，旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協調并加速數千個 GPU 之間的推理通信，并使用分離服務將大語

2025-03-20 15:03:55

1120

英偉達GTC2025亮點：Oracle與NVIDIA合作助力企業加速代理式AI推理

Oracle 數據庫與 NVIDIA AI 相集成，使企業能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布，NVIDIA 加速計算和推理軟件與 Oracle 的 AI

2025-03-21 12:01:55

1268

華為亮相2025金融AI推理應用落地與發展論壇

創新技術——UCM推理記憶數據管理器，旨在推動AI推理體驗升級，提升推理性價比，加速AI商業正循環。同時，華為攜手中國銀聯率先在金融典型場景開展UCM技術試點應用，并聯合發布智慧金融AI推理加速方案應用成果。

2025-08-15 09:45:05

1090

此芯科技發布“合一”AI加速計劃，賦能邊緣與端側AI創新

產品組合，覆蓋從1.5B至32B參數規模的端側AI模型推理需求，滿足工業、消費電子、智能終端等多樣化場景的部署需求，推動AI技術從云端向邊緣高效落地。“合一”AI加速計

2025-09-15 11:53:00

2011

一文看懂AI訓練、推理與訓推一體的底層關系

我們正在參加全球電子成就獎的評選，歡迎大家幫我們投票～～～謝謝支持很多人聽過“大模型”，但沒搞懂兩件事。我們總說AI有多強，但真正決定AI能否落地的，是它的兩個階段：訓練（Training）和推理

2025-09-19 11:58:22

1913

什么是AI模型的推理能力

NVIDIA 的數據工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎，該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。

2025-09-23 15:19:23

1043

華為數據存儲與「DaoCloud 道客」發布AI推理加速聯合解決方案

AI產業已從“追求模型能力極限”轉向“追求推理體驗最優化”，推理體驗決定用戶與AI的交互質感。當前推理應用快速發展，Token調用量爆發式增長，推理遇到“推不動、推得慢、推得貴”三大瓶頸，成為產業

2025-11-28 10:03:31

254

AI推理的存儲，看好SRAM？

電子發燒友網報道（文/黃晶晶）近幾年，生成式AI引領行業變革，AI訓練率先崛起，帶動高帶寬內存HBM一飛沖天。但我們知道AI推理的廣泛應用才能推動AI普惠大眾。在AI推理方面，業內巨頭、初創公司等都

2025-03-03 08:51:57

2682

已全部加載完成

搜索歷史

一文解析Numenta加速AI推理的的秘密

評論