国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

UWA平臺支持PowerVR芯片,新增四大GPU模塊分析

穎脈Imgtec ? 2022-10-19 11:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日前,游戲和VR應用性能優化平臺 UWA 宣布新的 GPU Counter 功能更新:增加了對 PowerVR 品牌 GPU 芯片的支持。針對 PowerVR GPUCounter,UWA提供了 GPU 負載、GPU 著色、GPU 帶寬、GPU 圖元 4 個模塊的分析。最新的 UWA SDK 2.4.4 已發布,下載最新版 SDK,并使用搭載 PowerVR GPU IP 芯片的設備進行測試,即可在GOT Online Overview的GPU模塊下查看到對應的數據,掌握GPU壓力和性能消耗情況。

以下針對PowerVR GPU Counter,圍繞UWA所提供的GPU 負載、GPU著色、GPU帶寬、GPU圖元4個模塊的分析進行詳細說明。


1、GPU負載

GPU Counter下的GPU負載包含Non Fragment Utilization和Fragment Utilization兩個性能指標,分別代表非片段處理占整體GPU處理耗時百分比和片段處理開銷占整體GPU處理開銷百分比。

9ddd0478-4f29-11ed-b116-dac502259ad0.png

在GPU上運行的工作負載由作業管理器統一協調,該任務管理器負責將工作負載調度到GPU內部的各個處理單元上,它將兩個FIFO工作隊列,稱為作業插槽。其中,一個插槽用于非片段工作負載,另一個插槽則用于片段著色工作負載。當出現GPU瓶頸時,正常情況下Non Fragment Utilization和Fragment Utilization至少有一個是接近100%,如果兩者都低于100%,則有可能是Non Fragment和Fragment之間存在數據依賴關系。

當Non Fragment Utilization過高時,開發者可以從頂點數、復雜的Compute Shader的使用情況以及Geometry Shader、Tessellation Shader等角度著手進行優化。當Fragment Utilization過高時,則可以考慮項目中是否存在是否存在片段數目過多、片段Shader過于復雜。


2、GPU著色

包含Overdraw和Cycles/Pixel兩個指標。

9df65c16-4f29-11ed-b116-dac502259ad0.png

Overdraw(過度繪制)

該項表示項目運行過程中,單幀中整個屏幕被填充的倍數。倍數越高,則GPU的壓力越大。在游戲運行過程中,場景中半透明物體的重合會使得同一個像素點在一幀中會被繪制多次,造成Overdraw過高的情況。如下圖所示,UI和粒子特效層疊導致容易出現Overdraw。9e0b3a28-4f29-11ed-b116-dac502259ad0.png

Cycles/Pixel

表示平均每個像素耗費的GPU時鐘周期。一般來說,Shader復雜度會極大地影響GPUCycles占用的情況。當畫面的Shader復雜度過高時,GPU需要消耗大量的時鐘周期對Shader進行運算,容易造成GPU耗時變高,造成卡頓。

因此,通過查看GPU著色模塊,就可以快速定位高Overdraw和高Cycles的場景,判斷這個場景的GPU壓力較高是Overdraw還是Shader復雜度過高造成的,進行有針對性的優化。


3、GPU帶寬

CPU一樣,GPU帶寬也是芯片耗電的重要指標。當GPU持續進行高負載外部讀寫時,掉電就會過快。

UWA的GPU帶寬模塊統計了測試過程中單幀的讀寫帶寬總量,通過查看GPU帶寬模塊,可以快速定位測試過程中帶寬較高的場景和原因,并進行進一步測試優化。9e3ef5e8-4f29-11ed-b116-dac502259ad0.png


4、GPU圖元處理渲染面是產生GPU壓力的重要因素之一,我們可以通過 Overview 模式里的 Triangle 指標來查看和分析哪些畫面的渲染面較多。

9e4bc48a-4f29-11ed-b116-dac502259ad0.png

渲染面過多,一方面可能是模型過于復雜,一般可以通過 LOD、HLOD 等常用技術來簡化遠距離的模型,在不影響畫質的情況下顯著降低渲染面;另一方面,可能是地形、大建筑物等大面積模型沒有進行適當的拆分,導致進入視域體的面片可能不多,但提交GPU的渲染面依然很多。對于第二種情況,我們可以通過新功能“GPU圖元”來進行初步的判斷。

9e798d84-4f29-11ed-b116-dac502259ad0.png

總圖元數:提交到GPU端的圖元總數,該數值基本等同于引擎端統計的渲染面片總數。可見圖元數:在GPU端通過各種裁剪之后,留下的參與渲染的三角面。可見圖元不包括:因為在視域體外而被裁剪的三角面,因為朝向而被裁剪的三角面。因此,在3D場景中,比較理想的情況下,可見圖元的數量應該接近或高于 50%(對于大部分模型,有一半三角面會因為朝向被裁剪)。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對性地檢查和優化場景中,這個角度下,被提交到GPU的大面積模型。

GPU圖元處理數量過多會對設備的帶寬和能耗造成較大的影響,應盡量在程序端完成剔除,并減小送往GPU的圖元數。

需要注意的是,基于架構不同,同一參數在不同品牌芯片上的推薦值也會存在差異,不同設備間橫向對比的意義不大,更推薦大家在相同的設備上進行縱向對比。同時,由于同品牌芯片的架構之間也會存在差異,UWA目前僅支持部分芯片的GPU Counter數據采集,具體支持設備列表可通過下圖或登錄UWA官網對“Mali/Power VR/Adreno GPUCounter支持設備”列表進行查詢:

https://www.uwa4d.com/main/supported.html9ec4f774-4f29-11ed-b116-dac502259ad0.png以上就是這次關于搭載 PowerVR GPU IP 芯片的新功能介紹了,希望會對開發者們在 GPU 優化上和項目的整體性能監控上有所幫助。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54007

    瀏覽量

    465907
  • vr
    vr
    +關注

    關注

    34

    文章

    9694

    瀏覽量

    157226
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是OVP芯片?深度解析DC9336V過壓保護的四大核心技術原理

    電路保護的關鍵是什么?本文從技術底層深度剖析熱芯科技DC9336V OVP芯片。詳細解讀高精度電壓監測、超快響應、自動恢復及寬壓ESD保護四大機制,幫助工程師理解如何防止電壓浪涌燒毀后端電路。
    的頭像 發表于 02-26 11:40 ?84次閱讀
    什么是OVP<b class='flag-5'>芯片</b>?深度解析DC9336V過壓保護的<b class='flag-5'>四大</b>核心技術原理

    從“可見”到“可控”:工業物聯網平臺如何重塑四大核心場景價值

    工業物聯網平臺的價值,絕非漂浮于概念層面,它必須根植于具體的業務場景,解決真實的生產經營難題。數之能深入行業實踐,聚焦于設備管理、生產執行、能源管控與安全運維四大核心領域,將平臺能力轉化為可量化、可
    的頭像 發表于 01-12 15:26 ?122次閱讀
    從“可見”到“可控”:工業物聯網<b class='flag-5'>平臺</b>如何重塑<b class='flag-5'>四大</b>核心場景價值

    我司正式加入UWA聯盟:以芯賦能視界,共筑超高清產業新生態

    服務創造新的價值空間! 一、UWA聯盟:全球超高清產業的重要平臺 ? ? ?? 世界超高清視頻產業聯盟 (UHD World Association,縮寫為UWA)是于2022年在北京成立的國際性、非營利的開放性技術合作組織,是
    的頭像 發表于 12-24 15:24 ?112次閱讀
    我司正式加入<b class='flag-5'>UWA</b>聯盟:以芯賦能視界,共筑超高清產業新生態

    和而泰發布四大自研核心技術平臺

    從智能家電到工業機器人,從新能源汽車到低空經濟,和而泰的四大技術平臺正在重新定義智能設備的"生命系統"。
    的頭像 發表于 10-13 16:08 ?1193次閱讀

    【上新速遞】RF02機架式媒體平臺新增款功能卡板

    RF02機架式媒體平臺自上市以來,憑借模塊化設計和全流程媒體處理能力,贏得廣泛客戶認可。為進一步提升RF02在各類場景下的制作效率,本次新增款功能卡板:FXC-A8800計算卡|一卡
    的頭像 發表于 09-25 14:21 ?681次閱讀
    【上新速遞】RF02機架式媒體<b class='flag-5'>平臺</b><b class='flag-5'>新增</b><b class='flag-5'>四</b>款功能卡板

    HarmonyOSAI編程頁面生成

    ;,調出命令,選擇Generate Page,進入頁面生成窗口。 輸入需要生成的頁面主題及要求。當前支持對美食、旅游、購物和新聞四大垂域進行頁面生成。點擊圖標,等待生成完成。 支持通過多輪對話
    發表于 08-29 15:50

    普迪飛 Exensio?數據分析平臺| FDC領航者,提升良率的關鍵鑰匙!

    ProcessControl(E-PC)是Exensio數據分析平臺四大主要模塊之一。作為一款在行業內處于領先地位的實時控制和分析工具,它
    的頭像 發表于 08-19 13:53 ?849次閱讀
    普迪飛 Exensio?數據<b class='flag-5'>分析</b><b class='flag-5'>平臺</b>| FDC領航者,提升良率的關鍵鑰匙!

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    Imagination最新發布的驅動(DDK25.1RTM2)支持最新版本Android操作系統,同時增強了OpenCL擴展集及Android平臺上Vulkan1.4支持。Vulkan
    的頭像 發表于 08-14 11:18 ?2288次閱讀
    Imagination <b class='flag-5'>GPU</b> 全面<b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    芯片制造的四大工藝介紹

    這一篇文章介紹幾種芯片加工工藝,在Fab里常見的加工工藝有種類型,分別是圖形化技術(光刻)?摻雜技術?鍍膜技術和刻蝕技術。
    的頭像 發表于 07-16 13:52 ?3781次閱讀
    <b class='flag-5'>芯片</b>制造的<b class='flag-5'>四大</b>工藝介紹

    四大核心要素驅動汽車智能化創新與相關芯片競爭格局

    當下,功能安全、高效高靈活性的算力、產品生命周期,以及軟件生態兼容性這“四大核心要素”,已成為衡量智能汽車AI芯片創新力和市場競爭力的核心標準。
    的頭像 發表于 07-01 14:49 ?677次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了
    發表于 06-18 19:31

    Tx-Rx 前端模塊,用于頻 GSM/ GPRS/ EDGE,支持 4 頻天線開關 skyworksinc

    電子發燒友網為你提供()Tx-Rx 前端模塊,用于頻 GSM/ GPRS/ EDGE,支持 4 頻天線開關相關產品參數、數據手冊,更有Tx-Rx 前端模塊,用于
    發表于 06-04 18:33
    Tx-Rx 前端<b class='flag-5'>模塊</b>,用于<b class='flag-5'>四</b>頻 GSM/ GPRS/ EDGE,<b class='flag-5'>支持</b> 4 頻天線開關 skyworksinc

    Tx-Rx 前端模塊,用于頻 GSM / GPRS,支持 4 頻天線開關 skyworksinc

    電子發燒友網為你提供()Tx-Rx 前端模塊,用于頻 GSM / GPRS,支持 4 頻天線開關相關產品參數、數據手冊,更有Tx-Rx 前端模塊,用于
    發表于 05-29 18:29
    Tx-Rx 前端<b class='flag-5'>模塊</b>,用于<b class='flag-5'>四</b>頻 GSM / GPRS,<b class='flag-5'>支持</b> 4 頻天線開關 skyworksinc

    iTOP-3588S開發板核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB內存,32GBEMMC。 核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內置NPU RK3588S內置NPU,支持INT4/INT8/INT1
    發表于 05-15 10:36

    iTOP-3588開發板采用瑞芯微RK3588處理器核心架構GPU內置獨立NPU強大的視頻編解碼

    架構,主頻高達2.4GHz。 核心架構GPU 集成Mali G610 MP4GPU支持OpenGLES 1.1.2.0、 3.2,
    發表于 04-09 16:09