国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NeRF的研究目的是合成同一場景不同視角下的圖像

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-01-29 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NeRF,即Neural Radiance Fields(神經輻射場)的縮寫。研究員來自UCB、Google和UCSD

Title:NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

Paper:https://arxiv.org/pdf/2003.08934.pdf

Code:https://github.com/bmild/nerf

寫這篇文章的動機是,一方面NeRF實在太重要了代表著計算機視覺、圖像學結合的未來重要方向;另一方面NeRF對于計算機視覺背景的同學有一定的理解門檻,這篇文章試圖以最小背景知識補充、最少理解成本為前提介紹NeRF。

整體介紹

NeRF的研究目的是合成同一場景不同視角下的圖像。方法很簡單,根據給定一個場景的若干張圖片,重構出這個場景的3D表示,然后推理的時候輸入不同視角就可以合成(渲染)這個視角下的圖像了。

「3D表示」有很多種形式,NeRF使用的是輻射場,然后用「體渲染」(Volume Rendering)技術,給定一個相機視角,把輻射場渲染成一張圖像。選用輻射場+體渲染的原因很簡單,全程可微分。這個過程很有意思,可以理解為把一個空間朝一個方向上拍扁,空間中的顏色加權求和得到平面上的顏色。

輻射場

7979651c-9f7f-11ed-bfe3-dac502259ad0.png

體渲染

所謂體渲染,直觀地說,我們知道相機的焦點,焦點和像素的連線可以連出來一條射線,我們可以對這條射線上所有的點的顏色做某種求和就可以得到這個像素的顏色值。

理論上,我們可以對這條射線經過空間上的每個點的密度(只和空間坐標相關)和顏色(同時依賴空間坐標和入射角)進行某種積分就可以得到每個像素的顏色。當每個像素的顏色都計算出來,那么這個視角下的圖像就被渲染出來了。如下圖所示:

7984c5e2-9f7f-11ed-bfe3-dac502259ad0.jpg

從相機焦點出發,往一個像素連出一條射線,獲取射穿過空間中每個點的屬性,進行積分得到這個像素的顏色

為了順利完成上面過程,我們可能需要維護碩大無朋Tensor來表示輻射場,查表獲取RGB和密度。這里一個問題是空間有多大表就有多大,同時只能是離散表示的。NeRF要做的事情是用一個神經網絡來建模輻射場,這樣無論空間有多大,不影響我們表示輻射場的所需要的存儲量,而且這個輻射場表示是連續的:?Θ:(?,?,?,?,?)→(?,?,?,?

799646fa-9f7f-11ed-bfe3-dac502259ad0.png

79a2b46c-9f7f-11ed-bfe3-dac502259ad0.jpg

用神經網絡來代替查表的方式表示輻射場

整體過程

因為神經網絡是可微分的,選取的體渲染方法是可微分;體渲染得到的圖片和原圖計算MSE Loss。整個過程可端到端地用梯度回傳來優化非常漂亮。整個訓練Pipeline如下圖所示:

79b9f91a-9f7f-11ed-bfe3-dac502259ad0.jpg

看到這,讀者就已經大致理解NeRF的原理了,后面章節是NeRF的具體細節。

用輻射場做體渲染

前面我們已經大致理解體渲染的過程是怎么做了。可是怎么沿著射線對空間中的顏色進行積分呢?如果我們把射線看作是光線,可以直觀得到這個積分要滿足的兩個條件:

1、一個點的密度越高,射線通過它之后變得越弱,密度和透光度呈反比

2、一個點的密度越高,這點在這個射線下的顏色反應在像素上的權重越大

79c63be4-9f7f-11ed-bfe3-dac502259ad0.png

而實際渲染過程,我們只能把射線平均分成N個小區間,每個區間隨機采樣一個點,對采樣得到的點的顏色進行某種加權求和:

79d6a290-9f7f-11ed-bfe3-dac502259ad0.png

神經輻射場的兩項優化點

Positional encoding

類似Transformer的做法,把坐標和視角用更高維度的表示作為網絡輸入,來解決渲染圖像比較糊的問題:

79e7de2a-9f7f-11ed-bfe3-dac502259ad0.png

Hierachical volume sampling

79f73cf8-9f7f-11ed-bfe3-dac502259ad0.png

Architecture

7a0404f6-9f7f-11ed-bfe3-dac502259ad0.png

私貨

無論從方法的開創性,還是發表后兩年多的影響力來看。在筆者心目中,ECCV 2020的Best Paper沒給NeRF,不得不說是一個遺憾。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    3011

    瀏覽量

    115015
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107751
  • RGB
    RGB
    +關注

    關注

    4

    文章

    831

    瀏覽量

    61938

原文標題:都2023年了,我不允許你還不懂NeRF

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    秀技術、亮場景、聚生態!唯創知音“寶創享”首秀,向“芯”而生!

    12月16日,福海街道這片匯聚866家國家級高新技術企業、841家規上工業企業、58家工信部"小巨人"的產業熱土上,一場關乎AI產業未來的場景對接盛會正式開啟。作為深耕AI語音
    的頭像 發表于 12-26 12:02 ?471次閱讀
    秀技術、亮<b class='flag-5'>場景</b>、聚生態!唯創知音“寶<b class='flag-5'>景</b>創享”首秀,向“芯”而生!

    中國車聯網行業加速滲透:一場“車聯萬物”的出行革命

    當汽車不再是孤立的機械載體,而是接入互聯網的智能終端,一場出行變革正悄然發生。近日,前瞻產業研究院發布《2018 - 2025年中國車聯網行業滲透率與用戶規模統計情況及預測》(稱“報告”),透過
    的頭像 發表于 12-04 11:22 ?559次閱讀

    無引導線的左轉場景,自動駕駛如何規劃軌跡?

    場景,想要很好地處理好無引導線左轉是個非常大的挑戰。但想要讓自動駕駛汽車滿足所有的出行需求,這一場景必須解決,那在無引導線的左轉場景
    的頭像 發表于 09-18 09:12 ?748次閱讀
    無引導線的左轉<b class='flag-5'>場景</b><b class='flag-5'>下</b>,自動駕駛如何規劃軌跡?

    衛星圖像智能合成系統全面解析

    衛星圖像智能合成系統全面解析
    的頭像 發表于 08-27 14:49 ?600次閱讀
    衛星<b class='flag-5'>圖像</b>智能<b class='flag-5'>合成</b>系統全面解析

    TTS文字合成語音芯片的使用場景

    TTS文字合成語音播報芯片的使用場景非常廣泛,可以適用于各行各業,主要應用于復雜的語音播報場景,下面小編帶大家起來了解一下。 傳統的語音播
    的頭像 發表于 08-22 17:11 ?1004次閱讀

    從開發工程師視角看TTS語音合成芯片

    功能機,有著諸多跨越性優勢。 、TTS 語音合成芯片vs傳統播報芯片 ()內容靈活性 傳統播報芯片如同老式唱片,內容固化。在產品生產時就已將固定語音內容燒錄進去,后續很難更改。若產品應用
    的頭像 發表于 08-13 14:52 ?829次閱讀

    電壓放大器驅動合成射流的渦結構演化與摻混增強機制研究

    速度的作用向下游運動,相互融合形成射流。合成射流已被應用于眾多流動控制領域,包括摻混增強、傳熱增強、流動分離控制等。本實驗通過粒子圖像測速(PIV)技術從瞬時流動結構演化的角度對合成
    的頭像 發表于 08-08 15:47 ?578次閱讀
    電壓放大器驅動<b class='flag-5'>合成</b>射流的渦結構演化與摻混增強機制<b class='flag-5'>研究</b>

    2025零售快閃店場景,如何選擇更可靠的SDWAN服務商?

    ##零售快閃店場景,如何選擇更可靠的SDWAN服務商?在快節奏的零售戰場,快閃店如同一場精心策劃的閃電戰——品牌在黃金地段突然出現,制造話題,引爆消費,又在熱潮未退時悄然離。然而,
    的頭像 發表于 08-04 17:32 ?2117次閱讀
    2025零售快閃店<b class='flag-5'>場景</b><b class='flag-5'>下</b>,如何選擇更可靠的SDWAN服務商?

    3Dfindit 提供的數字立方體模型為研究目的可視化提供了支持

    作為學習項目的部分,羅伊特林根教育大學的學生們在比辛根集中營紀念地的博物館中使用 3Dfindit 動畫立方體模型進行了學習。作為歷史教學研討會的部分,學生們研究了巴登-符騰堡州
    發表于 08-01 14:36

    火車車號圖像識別系統如何應對不同光照條件的識別問題?

    光譜成像技術的應用 先進的系統采用多光譜成像技術,能夠在不同光照條件捕捉車號信息。高動態范圍(HDR)攝像頭的應用,可同時獲取同一場景的多種曝光圖像,確保在強光直射或夜間低照度環境
    的頭像 發表于 07-15 11:37 ?742次閱讀
    火車車號<b class='flag-5'>圖像</b>識別系統如何應對不同光照條件<b class='flag-5'>下</b>的識別問題?

    航天科普|一場救援中的通信革命-衛星通信(下篇)

    當福來哥在云南雨崩的原始森林迷路,手機信號完全消失時,他背包里的衛星手機成為救命稻草—條包含坐標的求救短信穿透密林樹冠,直達3.6萬公里高空的天通衛星,小時后救援隊精準抵達。這一場景背后,是一場
    的頭像 發表于 07-01 17:03 ?1903次閱讀
    航天科普|<b class='flag-5'>一場</b>救援中的通信革命-衛星通信(下篇)

    HarmonyOS NEXT意圖框架習慣推薦一場景說明

    、概述 意圖框架是HarmonyOS系統級的意圖標準體系。將應用和元服務的業務功能智慧分發給不同的系統入口,以“音樂播放”為例,HarmonyOS將業務分發給“小藝建議”,提供了桌面大流量曝光
    發表于 06-18 15:06

    LLSM流媒體傳輸模塊 高動態圖像帶寬穩定技術突破

    高清實時視頻的能力。旦控制系統設定帶寬上限為500K,那么在多種場景,尤其是高動態圖像環境,帶寬的波動始終會控制在這個范圍內。我們在
    的頭像 發表于 05-27 17:58 ?1151次閱讀
    LLSM流媒體傳輸模塊  高動態<b class='flag-5'>圖像</b>帶寬穩定技術突破

    你以為的安全,真的安全嗎?——擬態安全,一場關于認知的博弈

    黑客的日常工作就像一場精心策劃的“入室盜竊”。首先“踩點”——掃描目標系統的端口、分析網絡流量、研究系統架構找出漏洞,但如果黑客發現系統會“變臉”,今天Windows,明天變成Linux,剛研究
    的頭像 發表于 04-14 10:45 ?553次閱讀
    你以為的安全,真的安全嗎?——擬態安全,<b class='flag-5'>一場</b>關于認知的博弈

    普渡機器人核心技術全面升級

    隨著智能技術向更多元場景滲透,多類型機器人(如清潔、配送等)在同一場景的協同作業需求日益增長。然而,復雜環境中的地圖復用、電梯調度、路徑沖突及人機交互等問題,成為制約效率與用戶體驗的關鍵挑戰。
    的頭像 發表于 03-27 16:17 ?990次閱讀