完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>
標簽 > gpu
圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上圖像運算工作的微處理器。
文章:4965個 瀏覽:135856次 帖子:308個
大語言模型(LLM)推理顯存需求呈指數級增長,70B參數的模型需要約140GB顯存(FP16),遠超單卡GPU容量。量化技術通過降低模型參數精度(從FP...
大模型服務報 CUDA out of memory,很多現場第一反應都是“模型太大,換更大的卡”。這個結論通常過于粗糙。生產里的顯存問題至少有五類來源:...
基于NVIDIA GPU加速端點使用千問3.5 VLM開發原生多模態智能體
阿里巴巴推出了全新開源 千問3.5 系列,專為構建原生多模態智能體而設計。該系列的首個模型是一款總參數為 397B、具備推理能力的原生視覺語言模型 (V...
7B 模型 FP16 推理需要約 14GB 顯存,70B 模型需要 140GB+,KV Cache 隨并發數線性增長,顯存碎片化導致實際利用率不足 60%。
Pod調度是Kubernetes的核心機制之一,決定了Pod最終運行在哪個節點上。默認調度器kube-scheduler通過一系列預選(Filterin...
2026-02-27 標簽:gpu數據庫kubernetes 227 0
借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程
NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的...
為滿足對 “納秒級實時響應” 與 “復雜數據深度運算” 的雙重需求,“FPGA+GPU”異構混合部署方案通過硬件功能精準拆分與高速協同,突破單一硬件的性...
破解AI服務器CPU/GPU供電困局:納秒級瞬態如何穩壓?MHz噪聲怎樣濾除?
本文摘要:AI芯片的算力狂奔,正將其供電網絡推向極限。核心電壓降至0.8-1.2V,單相電流沖擊達百安級,導致VRM輸出端出現納秒級(10-100ns)...
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產品,其各項核心...
NVIDIA RTX PRO 4000 Blackwell GPU性能測試
作為 NVIDIA 專業顯卡產品線中單槽性能的巔峰之作,NVIDIA RTX PRO 4000 Blackwell 在各項核心指標上均實現對前代 NVI...
如何在NVIDIA Jetson AGX Thor上部署1200億參數大模型
上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務,以及使用 Chatbox 作為前端調用...
如何在NVIDIA Jetson Thor上提升機器人感知效率
構建自主機器人需要具備可靠且低延遲的視覺感知能力,以實現在動態環境中的深度估計、障礙物識別、定位與導航。這些功能對計算性能有較高要求。NVIDIA Je...
AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?
CPU作為“通用基石”,支撐所有設備的基礎運行;GPU憑借并行算力,成為AI訓練與圖形處理的“主力”;TPU在Google生態中深耕云端大模型訓練;NP...
換一批
編輯推薦廠商產品技術軟件/工具OS/語言教程專題
| 電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯網 | NXP | 賽靈思 |
| 步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
| 伺服電機 | SVPWM | 光伏發電 | UPS | AR | 智能電網 | 國民技術 | Microchip |
| 開關電源 | 步進電機 | 無線充電 | LabVIEW | EMC | PLC | OLED | 單片機 |
| 5G | m2m | DSP | MCU | ASIC | CPU | ROM | DRAM |
| NB-IoT | LoRa | Zigbee | NFC | 藍牙 | RFID | Wi-Fi | SIGFOX |
| Type-C | USB | 以太網 | 仿真器 | RISC | RAM | 寄存器 | GPU |
| 語音識別 | 萬用表 | CPLD | 耦合 | 電路仿真 | 電容濾波 | 保護電路 | 看門狗 |
| CAN | CSI | DSI | DVI | Ethernet | HDMI | I2C | RS-485 |
| SDI | nas | DMA | HomeKit | 閾值電壓 | UART | 機器學習 | TensorFlow |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |