国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU設(shè)計(jì)實(shí)時(shí)光線追蹤面臨的挑戰(zhàn)

汽車玩家 ? 來源:Imagination ? 作者:RYS SOMMEFELDT ? 2020-03-08 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡管在理論上實(shí)現(xiàn)現(xiàn)代GPU的方法是無限的,但真正有效的方法是切實(shí)的了解問題并著手將方案變?yōu)楝F(xiàn)實(shí)。制造現(xiàn)代高性能半導(dǎo)體器件以及試圖加速當(dāng)前可編程光柵化技術(shù)所面臨的問題揭示了GPU硬件行業(yè)發(fā)展的未來趨勢。

例如在現(xiàn)代GPU中SIMD處理和固定功能紋理單元是必不可少的,以至于不使用它們來設(shè)計(jì)的GPU方案幾乎肯定意味著在研究之外不具有商業(yè)上的可行性和實(shí)用性。即使是過去20年來,任何一個(gè)GPU最瘋狂的愿景也沒有舍棄這些核心原則(安息吧,Larrabee(英特爾公司(GPU 的芯片代號))。

過去15年來實(shí)時(shí)光線追蹤加速一直被默認(rèn)為是GPU設(shè)計(jì)中最令人煩心的問題,關(guān)于光線追蹤應(yīng)該如何在GPU上實(shí)現(xiàn)的主流規(guī)范是微軟推出的DXR,它要求的執(zhí)行模型卻不能真正融入到GPU的工作模式,這無疑給任何需要支持它的GPU設(shè)計(jì)者帶來一些嚴(yán)重的潛在問題。如果實(shí)時(shí)光線追蹤是它們過去十年時(shí)間沒有考慮過的事情,那么這個(gè)問題會更加明顯,而Imagination一直在關(guān)注這個(gè)問題。

光線追蹤面臨的關(guān)鍵挑戰(zhàn)

如果你遵循DXR規(guī)范并考慮需要在GPU中實(shí)現(xiàn)些什么從而提供計(jì)算加速性能,那么你將很可能快速梳理出不管采用何種設(shè)計(jì)方案都需要解決的以下幾個(gè)問題:
首先你需要一種方法來生成和處理一組包含幾何體的數(shù)據(jù)結(jié)構(gòu),從而能以更有效的方式根據(jù)幾何體來跟蹤光線。其次當(dāng)追蹤光線時(shí),GPU要測試光線是否與之相交,要提供一些用戶可定義的編程接口。第三被跟蹤的光線可以發(fā)出新的光線!DXR規(guī)范定義的實(shí)現(xiàn)方案還需要考慮其他問題,但是從全局來看這三個(gè)因素是最重要的。

PowerVR光線追蹤混合渲染效果

生成和使用加速數(shù)據(jù)結(jié)構(gòu)來有效的表示需要做相交測試的幾何體意味著GPU可能要完成一個(gè)全新的執(zhí)行階段,然后我們需要用全新的接口函數(shù)處理這些新的數(shù)據(jù)結(jié)構(gòu),測試是否相交,之后在程序員的控制下根據(jù)相交測試的結(jié)果實(shí)現(xiàn)一些功能。GPU是并行的設(shè)計(jì),所以同時(shí)處理一堆光線意味著什么?這樣做是否發(fā)現(xiàn)了新挑戰(zhàn),而這些挑戰(zhàn)與傳統(tǒng)的幾何和像素并行處理所帶來的挑戰(zhàn)卻大不相同?

上一個(gè)問題的答案是非常肯定的,的確這些差異對如何將光線追蹤映射到現(xiàn)有的GPU執(zhí)行的模型中有著深遠(yuǎn)的影響。這些GPU存在計(jì)算資源和內(nèi)存資源的不平衡,導(dǎo)致內(nèi)存訪問成為一種寶貴的資源,而浪費(fèi)這些資源是導(dǎo)致效率和性能低下的最主要原因之一。

哦不——我們做了些什么?

GPU被設(shè)計(jì)成可以以任何形式充分利用與之連接的DRAM的訪問,利用內(nèi)存訪問的空間或時(shí)間局部性來作為實(shí)現(xiàn)這一目的的方法。值得慶幸的是最常見和最現(xiàn)代化的光柵化渲染有一個(gè)很好的特性,即在著色期間(尤其是像素著色通常是任何給定幀的主要工作負(fù)載)三角形和像素頂點(diǎn)有可能與它們的近鄰共享相關(guān)數(shù)據(jù)。因此,您訪問一組像素所需的任何緩存數(shù)據(jù),很可能下一個(gè)相鄰的組將需要使用您已經(jīng)從DRAM中提取并緩存的部分或全部內(nèi)存數(shù)據(jù)。對于當(dāng)今大多數(shù)柵格化渲染工作負(fù)載而言,這都是正確的,因此我們都可以松一口氣,并圍繞該屬性設(shè)計(jì)GPU架構(gòu)。
當(dāng)我們使用光線追蹤,這些就都失效了。光線追蹤使所有空間局部性消失。下面讓我們來分析其中的原因。

物體表面的問題

最簡單的思考方式就是觀察四周,在你坐下來閱讀這篇文章時(shí)注意光線在你所處環(huán)境中的作用。由于光線追蹤建模了光線從所有光源傳播時(shí)的屬性,因此它必須處理光線照射在場景中任何表面時(shí)發(fā)生的情況。也許我們只關(guān)心光線照射哪些物體,也許物體的表面以均勻的方向散射光線,但它也可能完全是隨機(jī)的。也許表面吸收了所有的光,因此不會有次級光線的傳播。也許表面有一種材質(zhì)屬性,使它能夠部分吸收幾乎所有照射來的光線,然后隨機(jī)散射它不能捕獲的少量光線。

只有第一種場景可以映射到GPU的利用內(nèi)存訪問局部性的工作模式,即使如此也只有當(dāng)所有并行處理的光線都照射到同一類型的三角形時(shí)才可以。

正是這種明顯分歧的可能性導(dǎo)致了這些問題,如果并行處理的任何光線相互之間可能會有不同的作用,包括撞擊不同的加速數(shù)據(jù)結(jié)構(gòu)或發(fā)出新的光線,那么GPU能高效工作的基本前提就會被破壞,而且這通常比在傳統(tǒng)的幾何圖形或像素處理中遇到的發(fā)散現(xiàn)象更具有破壞性。

相干性聚集

PowerVR對光線追蹤硬件加速的實(shí)現(xiàn)所做的是硬件光線追蹤和排序,它與當(dāng)今行業(yè)內(nèi)任何其他硬件光線追蹤加速相比都是獨(dú)一無二的,這對軟件方面來說是完全透明的,確保硬件上并行追蹤的發(fā)射光線具有潛在的相似性。我們稱之為相干性聚集。
硬件維護(hù)了一個(gè)數(shù)據(jù)結(jié)構(gòu),用于層次化的存儲軟件發(fā)出的正在被硬件處理的光線,并能夠根據(jù)它們的方向按它們在加速結(jié)構(gòu)中前進(jìn)的位置進(jìn)行選擇和分組。這意味著當(dāng)它們被處理時(shí)更可能共享存儲器中被訪問的加速數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù),且額外的優(yōu)勢是能夠最大化隨后要并行處理的光線-幾何體相交計(jì)算的數(shù)量。

通過分析由硬件調(diào)度的光線我們可以確保以GPU友好的方式對它們進(jìn)行分組,從而更高效的進(jìn)行后續(xù)處理,這些是該系統(tǒng)成功的關(guān)鍵,有助于避免打破GPU行業(yè)為高效的光柵化渲染而精心設(shè)計(jì)的運(yùn)行模式,這就避免了光線追蹤硬件對特殊類型存儲系統(tǒng)的需求,因此提供了與GPU的其他部分更容易集成的方案。

相干性聚集機(jī)制本身相當(dāng)?shù)膹?fù)雜,因?yàn)樗枰焖俚淖粉櫍判蚝驼{(diào)度所有的被提交到硬件中處理的光線,從而不會反壓前級用于發(fā)射光線的調(diào)度系統(tǒng),也不會造成后級以排序好的光線和加速數(shù)據(jù)結(jié)構(gòu)為輸入的硬件的空閑。

如果沒有硬件系統(tǒng)來幫助GPU處理光線排序,那么就需要依賴應(yīng)用程序或游戲開發(fā)人員以某種方式在主機(jī)上處理光線的相干性問題,或者在GPU上加入一個(gè)中間的計(jì)算環(huán)節(jié)來處理光線排序——前提是這種方式被硬件所支持,以上假設(shè)的方式中沒有一個(gè)能在實(shí)時(shí)的硬件平臺上提升效率和性能,然而Imagination是市場上唯一擁有這種硬件光線追蹤系統(tǒng)的GPU IP供應(yīng)商。

緊跟潮流

我們之所以成為行業(yè)內(nèi)唯一針對硬件光線追蹤提供解決方案的供應(yīng)商是因?yàn)槲覀円呀?jīng)致力于解決這個(gè)問題很長時(shí)間了,與行業(yè)中其他正在緩慢的進(jìn)展相比,光線追蹤已經(jīng)成為當(dāng)今圖形技術(shù)廣泛采用API之一了。

我們的相干性聚集特性與目前行業(yè)的光線追蹤相互兼容(如果光線恰好發(fā)射出新的光線,堆棧將會被釋放也可能發(fā)射出新的光線等等),在每個(gè)階段進(jìn)行相干性聚集處理并確保我們盡可能的實(shí)現(xiàn)硬件光線追蹤的強(qiáng)大性能。

在現(xiàn)代的硬件光線追蹤系統(tǒng)中最重要的是測量光線束、峰值并行測試率或空光線發(fā)射和未命中率,這些是描述光線追蹤硬件性能的簡單方式,但是也并不是非常的有用,畢竟開發(fā)人員并不只關(guān)心高峰值并行測試率或漏測率。

我們的目標(biāo)是在整個(gè)加速系統(tǒng)中使用全面的光線追蹤,這樣開發(fā)人員就可以用光線束預(yù)算要實(shí)現(xiàn)哪些有用的功能。我們的相干性聚集系統(tǒng)與我們提供的解決方案共同實(shí)現(xiàn)了這個(gè)目標(biāo),與行業(yè)內(nèi)的其他方案相比都是獨(dú)一無二的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135461
  • 光線追蹤
    +關(guān)注

    關(guān)注

    0

    文章

    185

    瀏覽量

    22097
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯片可靠性面臨哪些挑戰(zhàn)

    芯片可靠性是一門研究芯片如何在規(guī)定的時(shí)間和環(huán)境條件下保持正常功能的科學(xué)。它關(guān)注的核心不是芯片能否工作,而是能在高溫、高電壓、持續(xù)運(yùn)行等壓力下穩(wěn)定工作多久。隨著晶體管尺寸進(jìn)入納米級別,芯片內(nèi)部猶如一個(gè)承受著巨大電、熱、機(jī)械應(yīng)力考驗(yàn)的微觀世界,其可靠性面臨著原子尺度的根本性挑戰(zhàn)
    的頭像 發(fā)表于 01-20 15:32 ?305次閱讀
    芯片可靠性<b class='flag-5'>面臨</b>哪些<b class='flag-5'>挑戰(zhàn)</b>

    基于米爾RK3576的環(huán)視實(shí)時(shí)性方案解析

    、Mali-G52 GPU及高達(dá)6TOPS算力的NPU。本文旨在通過實(shí)際測試數(shù)據(jù),從功能實(shí)現(xiàn)、實(shí)時(shí)性能與AI拓展?jié)摿θ蠛诵木S度,為客戶提供一份關(guān)于該平臺在360環(huán)視應(yīng)用中能力的真實(shí)參考。 二、系統(tǒng)流程
    發(fā)表于 11-28 16:57

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    Blackwell 架構(gòu) GPU 中的中端專業(yè)圖形卡,高度僅為全高 GPU 的二分之一。如果您需要的是一塊半高顯卡,能適配小機(jī)箱,功耗不高,還要具備 AI 及光線追蹤性能的話,那么
    的頭像 發(fā)表于 11-28 09:39 ?6317次閱讀
    NVIDIA RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    物聯(lián)網(wǎng)追蹤器中的電池解決方案-以應(yīng)用于海運(yùn)集裝箱為例

    嚴(yán)格的二氧化碳排放法規(guī)。通過實(shí)時(shí)監(jiān)控貨物位置和狀態(tài),確保運(yùn)輸質(zhì)量。為應(yīng)對這些挑戰(zhàn),基于物聯(lián)網(wǎng)技術(shù)的物流追蹤系統(tǒng)正被越來越廣泛地采用。本文將特別聚焦于海運(yùn)集裝箱的物
    的頭像 發(fā)表于 10-30 17:37 ?636次閱讀
    物聯(lián)網(wǎng)<b class='flag-5'>追蹤</b>器中的電池解決方案-以應(yīng)用于海運(yùn)集裝箱為例

    目標(biāo)追蹤的簡易實(shí)現(xiàn):模板匹配

    : 二、目標(biāo)追蹤的分類與難點(diǎn) 目標(biāo)追蹤可以分為單目標(biāo)跟蹤、多目標(biāo)跟蹤、多目標(biāo)多攝像頭跟蹤(MTMCT)、姿態(tài)跟蹤等。相比于單純地在一幅圖中找到某一個(gè)物體,在一段視頻流中執(zhí)行的目標(biāo)追蹤往往會
    發(fā)表于 10-28 07:21

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    與邊緣AI的不同特點(diǎn): 邊緣推理的優(yōu)勢:可以提供數(shù)據(jù)處理速度和響應(yīng)速度,滿足實(shí)時(shí)需求;可以縮短網(wǎng)絡(luò)延遲,降低成本;可以提高安全性和隱私性,保護(hù)用戶數(shù)據(jù)。 前面說的都是好處,那面臨的困難有哪些呢
    發(fā)表于 09-12 16:07

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺,使用高級 API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架與 NVIDIA RTX 用于視覺渲染和模擬的實(shí)時(shí)光線追蹤相結(jié)合,使開發(fā)者能夠?yàn)?/div>
    的頭像 發(fā)表于 08-22 15:52 ?3719次閱讀
    NVIDIA Omniverse Extension開發(fā)秘籍

    如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行GPU性能分析

    在大語言模型的強(qiáng)化學(xué)習(xí)訓(xùn)練過程中,GPU 性能優(yōu)化至關(guān)重要。隨著模型規(guī)模不斷擴(kuò)大,如何高效地分析和優(yōu)化 GPU 性能成為開發(fā)者面臨的主要挑戰(zhàn)之一。
    的頭像 發(fā)表于 07-23 10:34 ?2402次閱讀
    如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行<b class='flag-5'>GPU</b>性能分析

    FOPLP工藝面臨挑戰(zhàn)

    FOPLP 技術(shù)目前仍面臨諸多挑戰(zhàn),包括:芯片偏移、面板翹曲、RDL工藝能力、配套設(shè)備和材料、市場應(yīng)用等方面。
    的頭像 發(fā)表于 07-21 10:19 ?1546次閱讀
    FOPLP工藝<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰(zhàn)</b>

    別讓 GPU 故障拖后腿,捷智算GPU維修室來救場!

    GPU也常面臨各類故障挑戰(zhàn),令使用者頭疼不已。常見GPU故障大盤點(diǎn)一、內(nèi)存故障引發(fā)性能“滑坡”以英偉達(dá)H100為例,在高負(fù)載、大規(guī)模集群運(yùn)行環(huán)境下,HBM3高帶寬
    的頭像 發(fā)表于 07-17 18:56 ?1149次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來救場!

    資產(chǎn)追蹤與室內(nèi)導(dǎo)航

    面展現(xiàn)出巨大潛力。 一:資產(chǎn)追蹤 資產(chǎn)追蹤是指通過技術(shù)手段實(shí)時(shí)監(jiān)控物理資產(chǎn)的位置、狀態(tài)和使用情況,幫助企業(yè)優(yōu)化資源利用,減少丟失或閑置。無論是醫(yī)療設(shè)備、物流貨物還是零售庫存,資產(chǎn)追蹤
    的頭像 發(fā)表于 07-04 18:22 ?541次閱讀

    光線追蹤及降噪技術(shù)綜述

    過程傳遞3D場景的結(jié)果。渲染主要包括光柵化(rasterization)[5]和光線追蹤[6]兩種方式。光柵化渲染采用局部光照原理,根據(jù)光源照射到物體上直接可見的
    的頭像 發(fā)表于 04-01 11:31 ?1034次閱讀
    <b class='flag-5'>光線</b><b class='flag-5'>追蹤</b>及降噪技術(shù)綜述

    NVIDIA Omniverse Kit 107的安裝部署步驟

    NVIDIA Omniverse 是一個(gè)模塊化平臺,使用高級 API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架與 NVIDIA RTX 用于視覺渲染和模擬的實(shí)時(shí)光線追蹤相結(jié)合,使開發(fā)者能夠?yàn)?/div>
    的頭像 發(fā)表于 03-28 10:37 ?1534次閱讀
    NVIDIA Omniverse Kit 107的安裝部署步驟

    智慧路燈的推廣面臨哪些挑戰(zhàn)

    引言 在智慧城市建設(shè)的宏偉藍(lán)圖中,叁仟智慧路燈的推廣面臨哪些挑戰(zhàn)?叁仟智慧路燈作為重要的基礎(chǔ)設(shè)施,承載著提升城市照明智能化水平、實(shí)現(xiàn)多功能集成服務(wù)的使命。然而,盡管叁仟智慧路燈前景廣闊,在推廣過程中
    的頭像 發(fā)表于 03-27 17:02 ?709次閱讀

    岳冉RFID技術(shù)智慧工廠生產(chǎn)物料實(shí)時(shí)追蹤管理解決方案

    岳冉RFID技術(shù)生產(chǎn)物料實(shí)時(shí)追蹤管理方案,通過全流程自動化感知、多維度數(shù)據(jù)融合及智能決策支持,助力企業(yè)實(shí)現(xiàn)物料管理的精準(zhǔn)化、透明化與協(xié)同化,為智能制造注入核心動能。
    的頭像 發(fā)表于 03-17 14:41 ?753次閱讀
    岳冉RFID技術(shù)智慧工廠生產(chǎn)物料<b class='flag-5'>實(shí)時(shí)</b><b class='flag-5'>追蹤</b>管理解決方案