GPU一推出就包含了比CPU更多的處理單元,更大的帶寬,使得其在多媒體處理過程中能夠發揮更大的效能。例如:當前最頂級的CPU只有4核或者6核,模擬出8個或者12個處理線程來進行運算,但是普通級別的GPU就包含了成百上千個處理單元,高端的甚至更多,這對于多媒體計算中大量的重復處理過程有著天生的優勢。下圖展示了CPU和GPU架構的對比。
從硬件設計上來講,CPU 由專為順序串行處理而優化的幾個核心組成。另一方面,GPU 則由數以千計的更小、更高效的核心組成,這些核心專為同時處理多任務而設計。
通過上圖我們可以較為容易地理解串行運算和并行運算之間的區別。傳統的串行編寫軟件具備以下幾個特點:要運行在一個單一的具有單一中央處理器(CPU)的計算機上;一個問題分解成一系列離散的指令;指令必須一個接著一個執行;只有一條指令可以在任何時刻執行。而并行計算則改進了很多重要細節:要使用多個處理器運行;一個問題可以分解成可同時解決的離散指令;每個部分進一步細分為一系列指示;每個部分的問題可以同時在不同處理器上執行。
舉個生活中的例子來說,你要點一份餐館的外賣,CPU型餐館用一輛大貨車送貨,每次可以拉很多外賣,但是送完一家才能到下一家送貨,每個人收到外賣的時間必然很長;而GPU型餐館用十輛小摩托車送貨,每輛車送出去的不多,但是并行處理的效率高,點餐之后收貨就會比大貨車快很多。
-
cpu
+關注
關注
68文章
11279瀏覽量
224999 -
gpu
+關注
關注
28文章
5194瀏覽量
135459
發布評論請先 登錄
基于NVIDIA GPU加速端點使用千問3.5 VLM開發原生多模態智能體
Altair CFD 以技術賦能工程創新?
RK3562 單板機圖形用戶界面開發完全手冊:Qt Creator 配置與 LVGL 案例詳解(二)
RK3562 單板機圖形用戶界面開發完全手冊:Qt Creator 配置與 LVGL 案例詳解(一)
RSoft GPU加速技術重塑光子元件設計效率革命
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
如何在NVIDIA Jetson平臺上運行最新的開源AI模型
沐曦股份GPU加速技術助力藥物研發降本增效
FPGA和GPU加速的視覺SLAM系統中特征檢測器研究
NVIDIA與合作伙伴推動物理AI發展
使用NVIDIA GPU加速Apache Spark中Parquet數據掃描
高效地擴展Polars GPU Parquet讀取器
NVIDIA技術驅動帕西尼觸覺感知與人形機器人智能突破
基于1.35M Instance設計的GPU加速實例
gpu加速原理
評論