国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何在光線跟蹤和碰撞檢測上下文中使用NanoVDB 庫的示例

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-28 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

開放式 VDB 是奧斯卡獎獲獎的稀疏動態卷的行業標準庫。在整個視覺效果行業中,它被用于模擬和渲染水、火、煙、云和大量其他依賴于稀疏體積數據的效果。該庫包括一個分層的、動態的數據結構和一套工具,用于高效地存儲和操作三維網格上離散的稀疏體數據。庫由 學院軟件基金會( ASWF ) 維護。有關詳細信息,請參見 VDB :具有動態拓撲的高分辨率稀疏卷 。

盡管 OpenVDB 提供了性能優勢,但它的設計并沒有考慮到 GPUs 。它對幾個外部庫的依賴使得利用 GPUs 上的 VDB 數據變得很麻煩,這正是本文主題的動機。我們將向您介紹 NanoVDB 庫,并提供一些如何在光線跟蹤和碰撞檢測上下文中使用它的示例。

NanoVDB 簡介

最初在 NVIDIA 開發的 NanoVDB 庫是一個 ASWF OpenVDB 項目的新增功能 。它提供了一個與 OpenVDB 的核心數據結構完全兼容的簡化表示,具有在 NanoVDB 和 OpenVDB 數據結構之間來回轉換、創建和可視化數據的功能。

poYBAGJqMpWAAPy-AAD5OmBKd9k476.png

圖 1 OpenVDB 和 NanoVDB 數據結構的圖示。

NanoVDB 采用了 VDB 樹結構的壓縮、線性化、只讀表示(圖 1 ),這使得它適合于樹層次結構的快速傳輸和快速、無指針遍歷。為了提高效率,數據流經過調整,可以在 GPUs 和 CPU 上使用。

創建 NanoVDB 網格

盡管 NanoVDB 網格是一種只讀數據結構,但該庫包含生成或加載數據的功能。

所有的 OpenVDB 網格類 – LevelSets 、 FogVolumes 、 PointIndexGrids 和 PointDataGrids ——都支持 NanoVDB 表示,并且可以直接從 OpenVDB 文件(即 。 vdb 系統 文件)加載。還可以將數據加載或保存到 NanoVDB 自己的文件格式中或從中保存,該格式本質上是其內存流的一個轉儲,其中包含用于高效檢查的附加元數據。

以下代碼示例從 OpenVDB 文件轉換:

以下代碼示例從 OpenVDB 文件轉換:

openvdb::io::File file(fileName);
auto vdbGrid = file.readGrid(gridName);
auto handle = nanovdb::openToNanoVDB(vdbGrid);

雖然從現有的 OpenVDB 數據加載是典型的用例,但是附帶的網格生成器工具允許您直接在內存中構建 NanoVDB 網格。提供了一些簡單原語的函數來幫助您入門:

// generate a sparse narrow-band level set (i.e. truncated signed distance field) representation of a sphere.
auto handle = nanovdb::createLevelSetSphere(50, nanovdb::Vec3f(0));

下面的示例顯示了如何使用 lambda 函數生成小而密集的體積(圖 2 ):

nanovdb::GridBuilder builder(0);
auto op = [](const nanovdb::Coord& ijk) -> float { return menger(nanovdb::Vec3f(ijk) * 0.01f);
};
builder(op, nanovdb::CoordBBox(nanovdb::Coord(-100), nanovdb::Coord(100)));
// create a FogVolume grid called "menger" with voxel-size 1
auto handle = builder.getHandle<>(1.0, nanovdb::Vec3d(0), "menger", nanovdb::GridClass::FogVolume);

網格控制柄

網格句柄 是一個簡單的類,它擁有它分配的緩沖區的所有權,允許網格的范圍劃分( RAII )。

它還用于封裝不透明的網格數據。盡管網格數據本身是以數據類型(如 浮動 為模板的),但句柄提供了一種方便的方法來訪問網格的元數據,而不必知道網格的數據類型 MIG 是什么。這很有用,因為您可以純粹從句柄確定 GridType 。

下面的代碼示例驗證是否有包含級別集函數的 32 位浮點網格:

const nanovdb::GridMetaData* metadata = handle.gridMetaData();
if (!metadata->isLevelSet() || !metadata->gridType() == GridType::Float) throw std::runtime_error("Not the right stuff!");

網格緩沖區

NanoVDB 被設計成支持許多不同的平臺, CPU , CUDA 甚至圖形 api 。為了實現這一點,數據結構被存儲在一個平坦的連續內存緩沖區中。

使這個緩沖區駐留在 CUDA 設備上很簡單。為了完全控制,您可以使用 CUDA api 分配設備內存,然后將句柄的數據上載到其中。

void* d_gridData;
cudaMalloc(&d_gridData, handle.size());
cudaMemcpy(d_gridData, handle.data(), handle.size(), cudaMemcpyHostToDevice);
const nanovdb::FloatGrid* d_grid = reinterpret_cast(d_gridData);

NanoVDB 的 GridHandle 模板化在緩沖區類型上,緩沖區類型是其內存分配的包裝器。它默認為使用主機系統內存的主機緩沖區;然而, NanoVDB 還提供了CUDA 緩沖器,以便輕松創建 CUDA 設備緩沖區。

auto handle = nanovdb::openToNanoVDB<nanovdb::CudaDeviceBuffer>(vdbGrid);
handle->deviceUpload();
const nanovdb::FloatGrid* grid = handle->deviceGrid();

將數據流解釋為納米網格類型后,可以使用這些方法訪問網格中的數據。有關更多詳細信息,請參閱相關 API 的文檔。本質上,它反映了 OpenVDB 中只讀方法的基本子集。

auto hostOrDeviceOp = [grid] __host__ __device__ (nanovdb::Coord ijk) -> float {
  // Note that ReadAccessor (see below) should be used for performance.
  return grid->tree().getValue(ijk);
};

可以構造自定義緩沖區來處理不同的內存空間。有關創建可與圖形 API 交互操作的緩沖區的示例的更多信息,請參閱存儲庫中的示例。

致使

由于 NanoVDB 網格提供了一個緊湊的只讀 VDB 樹,因此它們很適合渲染任務。光線將 VDB 網格跟蹤到圖像中。使用每線程一條光線,并使用一個自定義的 雷吉諾 functor 生成光線,該函數接受像素偏移并創建世界空間光線。完整的代碼在存儲庫示例中可用。

考慮到沿射線采樣具有空間相干性這一事實,可以使用 讀寫器 來加速采樣。當光線向前移動時,這會緩存樹遍歷堆棧,從而允許自底向上的樹遍歷,這比傳統的自上而下遍歷要快得多,后者涉及相對較慢的無界根節點。

auto renderTransmittanceOp = [image, grid, w, h, rayGenOp, imageOp, dt] __host__ __device__ (int i) {
    nanovdb::Ray wRay = rayGenOp(i, w, h);
    // transform the ray to the grid's index-space...
    nanovdb::Ray iRay = wRay.worldToIndexF(*grid);
    // clip to bounds.
    if (iRay.clip(grid->tree().bbox()) == false) {
        imageOp(image, i, w, h, 1.0f);
        return;
    }
    // get an accessor.
    auto acc = grid->tree().getAccessor();
    // integrate along ray interval...
    float transmittance = 1.0f;
    for (float t = iRay.t0(); t < iRay.t1(); t+=dt) {
        float sigma = acc.getValue(nanovdb::Coord::Floor(iRay(t)));
        transmittance *= 1.0f - sigma * dt;
    }
    imageOp(image, i, w, h, transmittance );
};

由于光線與水平集網格相交是一項常見任務, NanoVDB 實現了一個零交叉功能,并使用分層 DDA ( HDDA )作為沿光線的根搜索的一部分來清空空間跳躍(圖 5 )。有關 HDDA 的更多信息,請參閱 OpenVDB 中高效光線行進的分層數字微分分析儀 。下面是代碼示例:

...
    auto acc = grid->tree().getAccessor();
    // intersect with zero level-set...
    float iT0;
    nanovdb::Coord ijk;
    float v;
    if (nanovdb::ZeroCrossing(iRay, acc, ijk, v, iT0)) { 
        // convert intersection distance (iT0) to world-space
        float wT0 = iT0 * grid->voxelSize();
        imageOp(image, i, w, h, wT0);
    } else {
        imageOp(image, i, w, h, 0.0f);
    }
...

碰撞檢測

碰撞檢測和解決是 NanoVDB 的另一項任務,因為它們通常需要有效地查找實體碰撞對象的有符號距離值。窄帶電平集表示非常理想,因為它們用符號對內部/外部拓撲信息(碰撞檢測所需)進行了緊湊編碼。此外,最近點變換(沖突解決所需的)很容易從水平集函數的梯度計算。

下面的代碼示例是一個用于處理沖突的函數。使用 讀寫器 是很有用的,因為用于沖突解決的梯度計算涉及到同一空間附近的多個提取。

auto collisionOp = [grid, positions, velocities, dt] __host__ __device__ (int i) {
    nanovdb::Vec3f wPos = positions[i];
    nanovdb::Vec3f wVel = velocities[i];
    nanovdb::Vec3f wNextPos = wPos + wVel * dt;
    // transform the position to a custom space...
    nanovdb::Vec3f iNextPos = grid.worldToIndexF(wNextPos);
    // the grid index coordinate.
    nanovdb::Coord ijk = nanovdb::Coord::Floor(iNextPos);
    // get an accessor.
    auto acc = grid->tree().getAccessor();
    if (tree.isActive(ijk)) { // are you inside the narrow band?
        float wDistance = acc.getValue(ijk);
        if (wDistance <= 0) { // are you inside the levelset?
            // get the normal for collision resolution.
            nanovdb::Vec3f normal(wDistance);
            ijk[0] += 1;
            normal[0] += acc.getValue(ijk);
            ijk[0] -= 1;
            ijk[1] += 1;
            normal[1] += acc.getValue(ijk);
            ijk[1] -= 1;
            ijk[2] += 1;
            normal[2] += acc.getValue(ijk);
            normal.normalize();
            
            // handle collision response with the surface.
            collisionResponse(wPos, wNextPos, normal, wDistance, wNextPos, wNextVel);
        }
    }
    positions[i] = wNextPos;
    velocities[i] = wNextVel;
};

同樣,完整的代碼可以在存儲庫中找到。

基準

NanoVDB 被開發成在主機和設備上同樣運行良好。使用 modernCUDA 中的擴展 lambda 支持,您可以輕松地在兩個平臺上運行相同的代碼。

本節包括比較英特爾線程構建塊和 CPU CUDA 上光線跟蹤和碰撞檢測性能的基準測試。計時以毫秒為單位,與 NVIDIA NVIDIA 8000 相比,是在 Xeon E5-2696 v4 x2 –( 88 個 CPU 線程)上生成的。使用的 FogVolume 是兔子云, LevelSet 是 dragon 數據集。兩者都可以從 OpenVDB 網站下載。渲染的分辨率為 1024×1024 。這次碰撞試驗模擬了一億顆彈道粒子。

雖然基準測試(圖 6 和下表)顯示了 NanoVDB 高效表示加速 CPU 上 OpenVDB 的好處,但它真正突出了使用 GPU 對 VDB 數據進行只讀訪問以進行碰撞檢測和光線跟蹤的好處。

圖 6 Intel TBB 與 CUDA 的比較(越小越好)。

結論

NanoVDB 是一個小而強大的庫,它通過使用 GPUs 來加速某些 OpenVDB 應用程序。開源存儲庫現在可用了!要下載源代碼、構建示例

關于作者

Wil Braithwaite 在倫敦和洛杉磯的工作室工作了 15 年的視覺特效。他的職位包括研究、技術指導、合成、 CG 監督和 MOCAP 監督。他開創了圖形硬件在 VFX 管道中的應用,在 NVIDIA 擔任高級應用工程師,專門從事咨詢、培訓和使用 NVIDIA 技術協助 VFX 工作室項目的開發。

Ken Museth 是模擬技術的高級主管,并于 2020 年初加入 NVIDIA ,當時他發起了 NanoVDB 的開發。他以前在開發虛擬現實技術的時候,一直致力于虛擬現實的開發。他是 VDB 的創建者和 OpenVDB 的首席架構師,也是其技術指導委員會的主席。此外,肯在 SpaceX 公司工作了六年,對新的猛禽火箭發動機進行大規模流體動力學模擬。在 2017 年加入 Weta 之前,他在夢工廠動畫和數字領域工作了 10 年,在此之前,他曾在加州理工學院和林科平大學擔任研究員和全職教授。他擁有哥本哈根大學量子動力學博士學位,并獲得電影藝術與科學學院頒發的技術成就獎??鲜?SIGGRAPH 2020 技術論文委員會成員。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109715
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135427
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    奧迪威電池包碰撞檢測方案:通過觸覺表面傳感實現主動安全

    電池包碰撞檢測方案代表了從反應式到主動式電池安全管理的重大飛躍。通過提供一個持續的觸覺感知層,它為駕駛安全和電池系統完整性增加了一道不可或缺的保障。這項技術對于提升電動汽車的信任度、可靠性和整體安全范式至關重要。
    的頭像 發表于 02-25 11:16 ?219次閱讀
    奧迪威電池包<b class='flag-5'>碰撞檢測</b>方案:通過觸覺表面傳感實現主動安全

    NVIDIA BlueField-4為推理上下文記憶存儲平臺提供強大支持

    隨著代理式 AI 工作流將上下文窗口擴展到數百萬個 token,并將模型規模擴展到數百萬億個參數,AI 原生企業正面臨著越來越多的擴展挑戰。這些系統目前依賴于智能體長期記憶來存儲跨多輪、工具和會話持續保存的上下文,以便智能體能夠基于先前的推理進行構建,而不是每次請求都從頭
    的頭像 發表于 02-02 10:29 ?1004次閱讀
    NVIDIA BlueField-4為推理<b class='flag-5'>上下文</b>記憶存儲平臺提供強大支持

    大語言模型如何處理上下文窗口中的輸入

    本博客介紹了五個基本概念,闡述了大語言模型如何處理上下文窗口中的輸入。通過明確的例子和實踐中獲得的見解,本文介紹了多個與上下文窗口有關的基本概念,如詞元化、序列長度和注意力等。
    的頭像 發表于 12-03 13:48 ?591次閱讀
    大語言模型如何處理<b class='flag-5'>上下文</b>窗口中的輸入

    執行脫離上下文的威脅分析與風險評估

    作為WITTENSTEIN high integrity system(WHIS)公司的核心產品,SAFERTOS專為安全關鍵型嵌入式系統設計,使其成為確保聯網車輛環境可靠防護的理想選擇。在本文中
    的頭像 發表于 11-28 09:11 ?462次閱讀
    執行脫離<b class='flag-5'>上下文</b>的威脅分析與風險評估

    在CW32F030 MCU上設置外部中斷和RTC喚醒條件的示例

    (void) { // 在這里添加進入DeepSleep模式前的準備工作,比如保存上下文、禁用不必要的時鐘等 // 請求進入DeepSleep模式(具體實現可能依賴于你的MCU和HAL
    發表于 11-25 08:00

    請問riscv中斷還需要軟件保存上下文和恢復嗎?

    以下是我拷貝的文檔里的說明,這個中斷處理還需要軟件來寫上下文保存和恢復,在使用ARM核的單片機都不需要考慮這些的,使用過的小伙伴能解答嗎? 3.8. 進出中斷的上下文保存和恢復 RISC-V架構
    發表于 10-20 09:56

    HTTP開發必備:核心與httpplus擴展應用示例全攻略

    HTTP開發的必備參考!本文匯總核心基礎操作與httpplus擴展高級特性,通過示例解析,讓你快速上手各類HTTP開發需求。
    的頭像 發表于 09-20 15:19 ?3195次閱讀
    HTTP開發必備:核心<b class='flag-5'>庫</b>與httpplus擴展<b class='flag-5'>庫</b>應用<b class='flag-5'>示例</b>全攻略

    HarmonyOSAI編程智能問答

    多線程? 指定上下文問答 在對話框中輸入@符號,或點擊上方@Add Context按鈕,可指定對單個或多個代碼文件進行分析。點擊圖標開啟光標上下文功能,該功能可識別光標位置和選中的代碼片段,讓CodeGenie分析指定文件和選中的代碼片段。 本文主要從參考引用自Har
    發表于 09-03 16:17

    HarmonyOSAI編程編輯區代碼續寫

    利用AI大模型分析并理解開發者在代碼編輯區的上下文信息或自然語言描述信息,智能生成符合上下文的ArkTS或C++代碼片段。 使用約束 建議在編輯區內已有較豐富上下文,能夠使模型對編程場景有一定
    發表于 08-21 15:43

    HarmonyOS AI輔助編程工具(CodeGenie)智能問答

    DeepSeek-R1智能體,快速體驗智能問答能力。 一、對話示例 在對話區域輸入需要查詢的問題,開始問答。示例如下: ArkTS如何實現多線程? 二、指定上下文問答 在對話框中輸入@符號,或點擊上方@Add
    發表于 08-15 11:07

    鴻蒙NEXT-API19獲取上下文,在class中和ability中獲取上下文,API遷移示例-解決無法在EntryAbility中無法使用最新版

    摘要:隨著鴻蒙系統API升級至16版本(modelVersion5.1.1),多項API已廢棄。獲取上下文需使用UIContext,具體方法包括:在組件中使用getUIContext(),在類中使
    的頭像 發表于 07-01 10:57 ?778次閱讀
    鴻蒙NEXT-API19獲取<b class='flag-5'>上下文</b>,在class中和ability中獲取<b class='flag-5'>上下文</b>,API遷移<b class='flag-5'>示例</b>-解決無法在EntryAbility中無法使用最新版

    Transformer架構中編碼器的工作流程

    編碼器是Transformer體系結構的基本組件。編碼器的主要功能是將輸入標記轉換為上下文表示。與早期獨立處理token的模型不同,Transformer編碼器根據整個序列捕獲每個token的上下文
    的頭像 發表于 06-10 14:27 ?1062次閱讀
    Transformer架構中編碼器的工作流程

    S32K在AUTOSAR中使用CAT1 ISR,是否需要執行上下文切換?

    如果我們在 AUTOSAR 中使用 CAT1 ISR,是否需要執行上下文切換?另外,是否需要返回指令才能跳回到作系統?您有沒有帶有 CAT1 ISR 的 S32K3x4 微控制器的示例
    發表于 03-27 07:34

    在mimxrt1170_evk調試hello_world出現硬件傳輸錯誤怎么解決?

    錯誤 硬件傳輸錯誤 調試上下文:evkmimxrt1170_hello_world_cm4 LinkServer Debug 請指教,非常感謝!
    發表于 03-25 07:31

    為什么深度學習中的Frame per Second高于OpenVINO?演示推理腳本?

    在 DL Workbench 上使用 Microsoft 通用對象上下文 (MS COCO) 數據集運行 YOLOv4 對象檢測模型,并獲得 50 - 60 FPS。 OpenVINO?演示推理腳本運行,并獲得更高的 FPS。
    發表于 03-06 07:27