国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

搭載 PowerVR GPU IP 芯片的新功能介紹

Dbwd_Imgtec ? 來源:Imagination Tech ? 作者:Imagination Tech ? 2022-10-17 14:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日前,游戲和VR應用性能優化平臺 UWA 宣布新的 GPU Counter 功能更新:增加了對 PowerVR 品牌 GPU 芯片的支持。針對 PowerVR GPUCounter,UWA提供了 GPU 負載、GPU 著色、GPU 帶寬、GPU 圖元 4 個模塊的分析。 最新的 UWA SDK 2.4.4 已發布,下載最新版 SDK,并使用搭載 PowerVR GPU IP 芯片的設備進行測試,即可在GOT Online Overview的GPU模塊下查看到對應的數據,掌握GPU壓力和性能消耗情況。

以下針對PowerVR GPU Counter,圍繞UWA所提供的GPU 負載、GPU著色、GPU帶寬、GPU圖元4個模塊的分析進行詳細說明。

1、GPU負載

GPU Counter下的GPU負載包含Non Fragment Utilization和Fragment Utilization兩個性能指標,分別代表非片段處理占整體GPU處理耗時百分比和片段處理開銷占整體GPU處理開銷百分比。

91e6c744-4dc6-11ed-a3b6-dac502259ad0.png

在GPU上運行的工作負載由作業管理器統一協調,該任務管理器負責將工作負載調度到GPU內部的各個處理單元上,它將兩個FIFO工作隊列,稱為作業插槽。其中,一個插槽用于非片段工作負載,另一個插槽則用于片段著色工作負載。 當出現GPU瓶頸時,正常情況下Non Fragment Utilization和Fragment Utilization至少有一個是接近100%,如果兩者都低于100%,則有可能是Non Fragment和Fragment之間存在數據依賴關系。

當Non Fragment Utilization過高時,開發者可以從頂點數、復雜的Compute Shader的使用情況以及Geometry Shader、Tessellation Shader等角度著手進行優化。當Fragment Utilization過高時,則可以考慮項目中是否存在是否存在片段數目過多、片段Shader過于復雜。

2、GPU著色

包含Overdraw和Cycles/Pixel兩個指標。

921a7ec2-4dc6-11ed-a3b6-dac502259ad0.png

Overdraw(過度繪制)

該項表示項目運行過程中,單幀中整個屏幕被填充的倍數。倍數越高,則GPU的壓力越大。在游戲運行過程中,場景中半透明物體的重合會使得同一個像素點在一幀中會被繪制多次,造成Overdraw過高的情況。如下圖所示,UI和粒子特效層疊導致容易出現Overdraw。 92493866-4dc6-11ed-a3b6-dac502259ad0.png

Cycles/Pixel

表示平均每個像素耗費的GPU時鐘周期。一般來說,Shader復雜度會極大地影響GPUCycles占用的情況。當畫面的Shader復雜度過高時,GPU需要消耗大量的時鐘周期對Shader進行運算,容易造成GPU耗時變高,造成卡頓。

因此,通過查看GPU著色模塊,就可以快速定位高Overdraw和高Cycles的場景,判斷這個場景的GPU壓力較高是Overdraw還是Shader復雜度過高造成的,進行有針對性的優化。

3、GPU帶寬

CPU一樣,GPU帶寬也是芯片耗電的重要指標。當GPU持續進行高負載外部讀寫時,掉電就會過快。

UWA的GPU帶寬模塊統計了測試過程中單幀的讀寫帶寬總量,通過查看GPU帶寬模塊,可以快速定位測試過程中帶寬較高的場景和原因,并進行進一步測試優化。 93496c0e-4dc6-11ed-a3b6-dac502259ad0.png

4、GPU圖元處理 渲染面是產生GPU壓力的重要因素之一,我們可以通過 Overview 模式里的 Triangle 指標來查看和分析哪些畫面的渲染面較多。

9361d974-4dc6-11ed-a3b6-dac502259ad0.png

渲染面過多,一方面可能是模型過于復雜,一般可以通過 LOD、HLOD 等常用技術來簡化遠距離的模型,在不影響畫質的情況下顯著降低渲染面;另一方面,可能是地形、大建筑物等大面積模型沒有進行適當的拆分,導致進入視域體的面片可能不多,但提交GPU的渲染面依然很多。 對于第二種情況,我們可以通過新功能“GPU圖元”來進行初步的判斷。

939e87fc-4dc6-11ed-a3b6-dac502259ad0.png

總圖元數:提交到GPU端的圖元總數,該數值基本等同于引擎端統計的渲染面片總數。 可見圖元數:在GPU端通過各種裁剪之后,留下的參與渲染的三角面。 可見圖元不包括:因為在視域體外而被裁剪的三角面,因為朝向而被裁剪的三角面。因此,在3D場景中,比較理想的情況下,可見圖元的數量應該接近或高于 50%(對于大部分模型,有一半三角面會因為朝向被裁剪)。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對性地檢查和優化場景中,這個角度下,被提交到GPU的大面積模型。

93baad4c-4dc6-11ed-a3b6-dac502259ad0.png

GPU圖元處理數量過多會對設備的帶寬和能耗造成較大的影響,應盡量在程序端完成剔除,并減小送往GPU的圖元數。

需要注意的是,基于架構不同,同一參數在不同品牌芯片上的推薦值也會存在差異,不同設備間橫向對比的意義不大,更推薦大家在相同的設備上進行縱向對比。同時,由于同品牌芯片的架構之間也會存在差異,UWA目前僅支持部分芯片的GPU Counter數據采集,具體支持設備列表可通過下圖或登錄UWA官網對“Mali/Power VR/Adreno GPUCounter支持設備”列表進行查詢:

93e76d64-4dc6-11ed-a3b6-dac502259ad0.png ? 以上就是這次關于搭載 PowerVR GPU IP 芯片的新功能介紹了,希望會對開發者們在 GPU 優化上和項目的整體性能監控上有所幫助。  

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54007

    瀏覽量

    465931
  • 模塊
    +關注

    關注

    7

    文章

    2837

    瀏覽量

    53282
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135427
  • SDK
    SDK
    +關注

    關注

    3

    文章

    1101

    瀏覽量

    51713

原文標題:UWA平臺支持PowerVR芯片,新增四大GPU模塊分析

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    GPU與汽車安全有何關聯?

    汽車行業正在經歷自電子技術應用于汽車以來最深刻的變革。車輛正朝著軟件定義、智能網聯、AI驅動和持續迭代的方向演進。這一轉型帶來了前所未有的新功能,同時也引入了更高層級的網絡安全與功能安全風險。GPU
    的頭像 發表于 01-12 13:21 ?821次閱讀
    <b class='flag-5'>GPU</b>與汽車安全有何關聯?

    IP3102超低功耗 帶充放電控制功能的單節鋰電池保護芯片

    IP3102超低功耗 帶充放電控制功能的單節鋰電池保護芯片簡介IP3102提供一種用于單節鋰離子/聚合物可充電電池的初級保護的解決方案。IP
    發表于 10-24 19:32 ?0次下載

    蘋果AI革命:M5芯片10核GPU、AI處理速度翻倍,Apple Glass在路上

    三款核心設備。這一場蘋果圍繞M5芯片AI硬件的革新,也成為蘋果邁進AI時代以端側大模型和空間計算的又一成績。 ? ? 3nm+10核GPU革命,AI算力暴增4倍 蘋果官網介紹,M5芯片
    的頭像 發表于 10-19 01:13 ?1.1w次閱讀
    蘋果AI革命:M5<b class='flag-5'>芯片</b>10核<b class='flag-5'>GPU</b>、AI處理速度翻倍,Apple Glass在路上

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    的我我們講解了這幾種芯片的應用場景,設計流程、結構等。 CPU: 還為我們講解了一種算法:哈希表算法 GPU介紹了英偉達H100GPU
    發表于 09-12 16:07

    蔡司軟件 | ZEISS CALYPSO在航空航天行業的實用新功能

    蔡司軟件 | ZEISS CALYPSO在航空航天行業的實用新功能
    的頭像 發表于 08-08 15:37 ?841次閱讀
    蔡司軟件 | ZEISS CALYPSO在航空航天行業的實用<b class='flag-5'>新功能</b>

    當貝X5S Plus搭載MediaTek MT9669旗艦投影芯片

    當貝 X5S Plus 搭載的 MediaTek MT9669 旗艦投影芯片集成高效能、多核 CPU、GPU 及專用 AI 處理單元(APU),以強悍算力,保障你的流暢絲滑投影體驗。
    的頭像 發表于 07-17 17:58 ?1962次閱讀

    【VisionFive 2單板計算機試用體驗】1、開箱初體驗(刷系統+靜態IP設置+GPU跑分測評)

    文件:注意:balenaEtcher這個軟件表面上可以選擇bz2文件,但是在軟件內解壓的話會卡在73%的進度。所以,bz2文件要先解壓,再用balenaEtcher燒錄鏡像到TF卡。 開機設置靜態IP
    發表于 07-09 21:50

    MT6765_MTK6765安卓核心板_Helio P35處理器簡介/芯片功能資料

    MT6765是一款兼具高效能與多功能的智能芯片,采用主頻高達2.3GHz的八核ARM Cortex-A53處理器,結合臺積電12納米FinFET制程工藝,提供出色的性能和低能耗表現。芯片內置頻率達
    的頭像 發表于 07-01 20:17 ?2550次閱讀
    MT6765_MTK6765安卓核心板_Helio P35處理器簡介/<b class='flag-5'>芯片</b><b class='flag-5'>功能</b>資料

    【HarmonyOS 5】應用更新功能詳解

    與迭代需求的優選方案。這類彈窗主要用于向用戶推送新版本更新通知,而在引導用戶完成更新操作的實現層面,HarmonyOS 提供了完善的應用市場能力支撐,例如本文所介紹的 updateManager(更新功能
    發表于 06-22 18:44

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構的基礎知
    發表于 06-18 19:31

    IP6802 5W方案

    本文介紹了國內團隊自主研發的無線充電芯片IP6802,其單芯片構建完整生態IP6802的革命性突破,將傳統分立式電路濃縮為單
    的頭像 發表于 06-02 08:57 ?724次閱讀
    <b class='flag-5'>IP</b>6802 5W方案

    IP6825+IP5306充電寶:重新定義便攜電源的無線充電體驗

    本文主要介紹了兩種充電寶方案:IP6825和IP5306。IP6825是創新解決方案,通過高效充放電和磁吸無線充電將充電寶的便捷性和功能性提
    的頭像 發表于 05-19 08:56 ?1555次閱讀
    <b class='flag-5'>IP6825+IP</b>5306充電寶:重新定義便攜電源的無線充電體驗

    iTOP-3588S開發板四核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強 iTOP-3588S開發板采用瑞芯微RK3588S處理器,是全新一代AloT高端應用芯片搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構主頻高達2.4GHZ
    發表于 05-15 10:36

    軟件更新 | 你期待的新功能來了!TSMaster 202502 新版本亮點搶先看!

    備受期待的TSMaster202502最新版終于來了!在本月更新中,我們為用戶帶來了超多全新功能,旨在進一步提升軟件的性能、靈活性與用戶體驗。接下來,我們將為您詳細介紹本次更新的亮點內容,幫助
    的頭像 發表于 03-07 20:03 ?1473次閱讀
    軟件更新 | 你期待的<b class='flag-5'>新功能</b>來了!TSMaster 202502 新版本亮點搶先看!

    博世GTM IP模塊架構介紹

    上篇文章我們介紹了博世GTM IP模塊的核心功能及基礎結構模塊。本篇文章將繼續解析GTM模塊架構,重點介紹I/O模塊,特殊功能模塊及內核模塊
    的頭像 發表于 03-07 17:50 ?2485次閱讀
    博世GTM <b class='flag-5'>IP</b>模塊架構<b class='flag-5'>介紹</b>