根據Grandview Research的預測,到2030年全球云游戲市場將超過200億美元,其中亞太地區將占據約45%的市場機會。然而,目前主流的GPU解決方案主要是為數據中心計算而設計的,并不適用于云游戲獨特的經濟模型。云游戲的盈利能力依賴于在保持高質量用戶體驗的前提下,每顆GPU能支持的高并發用戶數量。
對于正在開發云游戲硬件的公司而言,選擇合適的GPU IP將決定其產品能否快速成功進入市場,或因延遲而承擔巨大成本。Imagination的E系列采用經過驗證且可擴展的架構,幫助團隊以更低風險、更佳投資回報率(ROI)打造差異化產品、加速上市。
任何新硬件若想在激烈競爭中站穩腳跟,必須在性能、特性與成本上找到正確平衡。關鍵要求包括:可擴展并持續穩定的性能、滿足多用戶服務場景的能力、對目標應用的全面支持,以及在小面積(降低晶體管成本)與低功耗(降低運維成本)下實現上述能力。
Imagination是著名的PowerVR GPU架構的研發公司。盡管Imagination的IP起源于移動、消費電子和汽車領域,但近年來越來越多的云計算與個人計算定制顯卡廠商采用其GPU IP。例如,芯動科技的風華系列顯卡便采用了Imagination的GPU技術。
今年早些時候,Imagination推出了全新的E 系列 GPU 內核:一款高能效的GPU IP,集成32 TOPS INT8的片上AI加速能力,并支持每核16個虛擬環境。本文將介紹云游戲顯卡廠商如何基于E系列實現產品差異化。
云游戲的持續幀率表現
用于桌面市場的Imagination GPU每核可實現72 GPixel/s的性能,并可通過多核技術進一步擴展(稍后會詳細介紹)。持續性能得益于一系列最大化GPU利用率并降低熱降頻的架構基礎設計:
高效的SIMT執行模型:多線程執行相同指令提升吞吐量,降低控制開銷;同時共享指令獲取與解碼階段,提高資源利用率。Imagination最新GPU在每個著色集群中可支持128條并行線程。
先進的調度能力:細粒度調度機制確保著色器核心保持忙碌,避免停頓,即使在游戲負載變化時也能維持高利用率。
強調本地存儲訪問:將中間計算結果存儲在快速本地存儲中,可減少外部DRAM往返,從而在復雜視覺效果中提供更高性能。
基于Tile的延遲渲染(TBDR)技術:將畫面分成更小的tile并在芯片內部處理,可最大程度降低外部內存帶寬使用;減少overdraw可在高幾何復雜度場景中提升效率。(欲了解TBDR在桌面與數據中心市場的適用性,請參考相關博客文章。)
先進壓縮技術:減少系統中數據傳輸量可大幅降低功耗,并提升幀率持續性。
這些特性相互配合,為云游戲用戶提供穩定、無抖動(jitter-free)的體驗。它們還與全新的高能效E系列Burst Processor(爆發處理器)協同工作,大幅提升性能并降低功耗,使圖形管線始終保持高效運行。
爆發處理器(Burst Processor)改變了計算邏輯單元處理任務的方式。它不再每個周期切換任務,而是將操作以不可分割的單元提交至計算邏輯單元,從而避免任務中斷,并減少對寄存器存儲器低效讀寫操作的次數。該方案還允許在ALU內部存儲中間數據,進一步減少寄存器存儲器的讀寫操作量。通過降低對寄存器存儲器的整體需求,GPU能有效提升利用率并持續更長時間保持高性能——這正是云游戲需要持久性能表現的理想方案。
為計算密集型特效提供額外性能
無論是3A大作還是休閑游戲,如今都越來越多地包含計算密集型細節。諸如模糊和景深等流行特效需要GPU執行復雜的數據采樣和數學運算。為高效處理此類特效,GPU最初演進出了通用計算著色器,而E系列在此基礎上更進一步。
E系列的GPU內置AI加速功能,在執行低精度運算(如FP16或INT8)時,速度比D系列同類產品快4倍。在1GHz頻率下,單顆E系列GPU可提供:
傳統著色器工作負載:2 FP32 TFLOPS
AI加速渲染:16 FP16 TFLOPS
AI工作負載與渲染:32 TOPS INT8

E系列GPU內置AI加速器集成于統一著色集群(USC)內部,以實現性能最大化并降低帶寬消耗。
最核心的設計在于:E系列GPU將矩陣乘法加速功能集成于計算邏輯單元(ALU)內部。相較于在遠離著色集群的位置增設獨立加速單元,這種集成式設計顯著減少數據移動,從而在降低帶寬消耗和功耗的同時提升性能。開發者可通過主流GPU API和行業標準擴展輕松調用這些額外性能。
基于E系列GPU的顯卡由此能高效運用AI技術加速渲染流程的關鍵環節。云游戲公司可借助超級分辨率等主流解決方案,更快更高效地生成高分辨率幀,從而實現單張GPU承載更多玩家的目標。
無縫擴展
我們的GPU可通過提升時鐘頻率實現更高性能;更重要的是——這對云游戲顯卡設計師至關重要——它們能構建成多核解決方案。
Imagination創新的多核架構無需直接依賴中央處理單元連接,即可靈活實例化任意數量的GPU核心。這有別于傳統GPU可擴展性方案——后者受限于所有著色器核心必須連接至單一集中化模塊,該模塊包含集中式內存數據路徑、任務管理器及幾何切片引擎。傳統方案常遭遇擁塞與布局靈活性問題。
我們的多核擴展流程采用去中心化松耦合架構,既為芯片設計師提供布局與設計自由度,又實現帶寬效率最大化。精心設計確保圖形工作負載能在不同核心間無縫擴展,最大限度減少瓶頸。例如,不同核心上的E系列分塊加速器可同時處理非依賴性幾何工作負載,使GPU能快速渲染復雜的AAA級游戲。
欲了解Imagination GPU高效擴展的更多原理,請參閱此博客。
對于云游戲顯卡而言,這首先意味著E系列GPU可擴展至服務商期望的性能水平。Imagination的多核解決方案還具備額外優勢:每個核心作為獨立GPU,可動態重配置為協同工作(實現單用戶性能最大化)或獨立運行(實現多租戶靈活性最大化)。

采用主-從模式協同運作的多核網格,以實現單用戶性能最大化。

采用主-主模式運行的多核網格,以實現最大靈活性。
通過靈活的多用戶能力,使收入最大化
云服務提供商通常會設置不同的價格等級,以最大化其收入來源。因此,不同的用戶需要不同級別的圖形性能,而云游戲GPU則必須具備高度靈活的工作負載分配能力來滿足這些差異化需求。
為此,我們的GPU IP集成了一個智能固件處理器,能夠直接處理GPU事件。它負責管理與其他GPU核心及第三方處理器之間的交互、對渲染任務進行優先級排序,以及處理錯誤與調試。這與許多依賴CPU和驅動棧進行調度的GPU IP供應商不同,后者無法提供同等水平的靈活性。
這個智能固件處理器使E系列GPU能夠支持多種云游戲場景:從在單顆GPU核心上運行多個容器,到將多個核心組合并動態協調跨核心的工作負載,以提供最大化的單用戶體驗。
虛擬化是云環境中另一項關鍵的多任務技術。它可以用于保障高端用戶的安全與隱私,或支持遠程桌面等使用場景。對于服務提供商來說,在一顆GPU上承載多個虛擬機(VM)也有助于實現故障隔離,避免其中一個虛擬機的崩潰影響到其他玩家。
E系列GPU提供先進的基于硬件的虛擬化方案(HyperLane),每核可運行多達16個不同的操作系統,并實現完整的內存隔離、無干擾、服務質量(QoS)保障和任務優先級控制。由于HyperLane是硬件級方案,其性能更高、軟件復雜度更低,相比其他軟件虛擬化方式具有明顯優勢。
想了解更多關于Imagination獨特虛擬化技術的信息,請參閱相關白皮書。
以ROI為導向的設計
Imagination的產品可以擴展至云級性能,但我們的GPU架構即便在高性能條件下也保持其著名的面積效率和功耗效率。我們堅持“以更少實現更多”的理念,這在云市場中尤為關鍵。對面積敏感的架構可以降低定制芯片的開發成本,提高新方案的競爭力;低功耗產品則有助于服務商控制能源成本。
E系列進一步提升了Imagination的效率水平:
- 提供超過D系列3倍的計算性能密度
- 在采用神經核(Neural Cores)和爆發處理器(Burst Processors)后功耗效率提升最高可達35%
- 成熟的軟件生態體系
云游戲平臺可以放心依賴Imagination GPU提供強大的軟件支持,以運行當今最具挑戰性的游戲大作。隨著云端Android休閑游戲在市場上占據主導,Imagination在Android生態中的深厚積累——基于多年來在移動領域的領先經驗——使其成為值得信賴的選擇。
我們的GPU完整支持Khronos Group的主流移動圖形API:
Vulkan
OpenGL ES
確保從設備到云端順暢、可擴展的游戲體驗。
在PC游戲方面,我們最新一代GPU增加了對DirectX的硬件級支持,而E系列進一步擴展至支持DirectX 12,并提供高性能PC游戲的參考驅動。對于較老的游戲,E系列也通過ZINK框架支持OpenGL 4.6。
結語
隨著云游戲的快速增長,特別是在中國等關鍵市場,硬件設計者需要一種在性能、可擴展性與能效之間取得平衡、沒有妥協的GPU IP。Imagination的E系列GPU架構提供了極具吸引力的解決方案——將強大的圖形渲染、AI加速、多用戶能力與功耗優化設計融為一體。
無論您面向的是大眾休閑云游戲市場,還是高端AAA游戲體驗,E系列都具備足夠的靈活性和強大能力,幫助您的產品實現差異化,并加速上市進程。憑借在多個行業中的成熟部署與對主流API的廣泛支持,E系列是下一代云游戲硬件的不二之選。
如需了解有關E系列的更多信息,請閱讀預覽白皮書,或聯系Imagination團隊安排評估。
英文鏈接:https://blog.imaginationtech.com/building-custom-graphics-cards-for-cloud-gaming
聲明:本文為原創文章,轉載需注明作者、出處及原文鏈接。
-
顯卡
+關注
關注
16文章
2520瀏覽量
71490 -
云游戲
+關注
關注
0文章
49瀏覽量
3612
發布評論請先 登錄
支持OpenGL 4.6與Vulkan 1.3,摩爾線程發布圖形顯卡驅動v320.130
從游戲引擎到AI動力核心
【VisionFive 2單板計算機試用體驗】2、打造復古游戲機(Batocera鏡像+FBNeo虛擬機, 多款游戲ROM分享)
【VisionFive 2單板計算機試用體驗】VisionFive 2一個霸氣的游戲機
游戲玩家的聽覺革命!這款虛擬 7.1 游戲聲卡評估板讓你 “聲” 臨其境!
超150款游戲現已支持NVIDIA Reflex
Windows盯上游戲,要做第一平臺
用 Lakka 和 樹莓派 打造終客廳游戲機!
摩爾線程發布圖形顯卡驅動程序v300.110
摩爾線程發布圖形顯卡驅動程序v290.100.2
技嘉正式推出 RTX? 5060 Ti 和 5060 顯卡,先進散熱方案提升游戲與 AI 體驗
普誠PT2513B,為顯卡散熱賦能
云游戲的基礎資源類型
為云游戲打造定制顯卡
評論