據(jù)外媒報(bào)道,現(xiàn)在有一種全新的成像方法可以利用人工智能(AI)將時(shí)間轉(zhuǎn)換為3D空間視覺,以幫助汽車、移動(dòng)設(shè)備和健康檢測(cè)器研發(fā)360度感知能力。照片和視頻通常都通過利用數(shù)字傳感器捕捉光子(光的組成部分)制作而成,例如,數(shù)碼相機(jī)由數(shù)百萬個(gè)像素組成,通過探測(cè)空間中每一個(gè)點(diǎn)的光的強(qiáng)度和顏色來形成圖像。然后,通過在被拍攝的對(duì)象周圍放置兩個(gè)或多個(gè)相機(jī),對(duì)其進(jìn)行多角度拍攝,或者利用光子流掃描場(chǎng)景并在3D空間中進(jìn)行重建,就可以生成3D圖像。無論采用上述何種方式,就是通過收集場(chǎng)景中的空間信息來構(gòu)建圖像。
據(jù)外媒報(bào)道,最近,英國格拉斯哥大學(xué)(University of Glasgow)與意大利米蘭理工大學(xué)(Polytechnic University of Milan)和荷蘭代爾夫特理工大學(xué)(Delft University of Technology)的研究人員描述了一種制作3D動(dòng)畫的全新方法,即通過捕獲光子的時(shí)間信息,而不是空間坐標(biāo)來進(jìn)行制作。
首先,研究人員們采用一種簡單、廉價(jià)的單點(diǎn)探測(cè)器,將其調(diào)整為光子的秒表。與測(cè)量空間中光的顏色和強(qiáng)度分布的相機(jī)不同,該探測(cè)器只記錄由瞬間激光脈沖產(chǎn)生的光子從既定場(chǎng)景中的每個(gè)物體上反射到傳感器所需的時(shí)間。物體越遠(yuǎn),每個(gè)光子反射到傳感器所需的時(shí)間就越長。每個(gè)光子在場(chǎng)景中反射的時(shí)間信息稱為時(shí)間數(shù)據(jù),被研究人員收集在一個(gè)非常簡單的圖表中。
然后,在復(fù)雜神經(jīng)網(wǎng)絡(luò)算法的幫助下,此類圖表被轉(zhuǎn)換成3D圖像。研究人員對(duì)該算法進(jìn)行了訓(xùn)練,向其展示了數(shù)千張普遍照片(包含團(tuán)隊(duì)在實(shí)驗(yàn)室周圍移動(dòng)和搬運(yùn)物體的內(nèi)容)以及由單點(diǎn)探測(cè)器同時(shí)捕獲的時(shí)間數(shù)據(jù)。
最終,該神經(jīng)網(wǎng)絡(luò)充分了解到時(shí)間數(shù)據(jù)如何與照片相對(duì)應(yīng),從而能夠僅利用時(shí)間數(shù)據(jù)創(chuàng)建高度精確的圖像。在原理驗(yàn)證實(shí)驗(yàn)中,盡管硬件和算法可能每秒會(huì)產(chǎn)生成千上萬張圖像,該團(tuán)隊(duì)還是成功以大約每秒10幀的速度利用時(shí)間數(shù)據(jù)構(gòu)造出動(dòng)態(tài)圖像。
目前,該神經(jīng)網(wǎng)絡(luò)創(chuàng)建圖像的能力受限于所經(jīng)受的訓(xùn)練,此類訓(xùn)練讓其可以從研究人員所創(chuàng)建的場(chǎng)景的時(shí)間數(shù)據(jù)中進(jìn)行挑選。不過,通過進(jìn)一步訓(xùn)練,甚至采用更高級(jí)的算法,該神經(jīng)網(wǎng)絡(luò)可以學(xué)會(huì)將各種各樣的場(chǎng)景進(jìn)行可視化,并擴(kuò)大應(yīng)用于現(xiàn)實(shí)環(huán)境中。
研究人員表示:“收集時(shí)間數(shù)據(jù)的單點(diǎn)探測(cè)器體積小、重量輕、價(jià)格便宜,因而很容易被加入到自動(dòng)駕駛汽車攝像頭等現(xiàn)有系統(tǒng)中,以提高汽車尋路的準(zhǔn)確性和速度。此外,還可以增強(qiáng)谷歌Pixel 4等移動(dòng)設(shè)備上現(xiàn)有的傳感器,因?yàn)镻ixel 4已經(jīng)配備了一個(gè)基于雷達(dá)技術(shù)的簡單手勢(shì)識(shí)別系統(tǒng)。此外,我們的新技術(shù)甚至可用于監(jiān)測(cè)醫(yī)院病人胸部的升降情況,以提醒醫(yī)護(hù)人員觀察病人的呼吸變化,或者跟蹤病人的行動(dòng),確保其安全。我們的下一步是研發(fā)一種獨(dú)立的便攜式盒裝系統(tǒng),并希望能夠與商業(yè)伙伴一起研究。”
責(zé)任編輯:tzh
-
3D
+關(guān)注
關(guān)注
9文章
3011瀏覽量
115032 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107756 -
AI
+關(guān)注
關(guān)注
91文章
39789瀏覽量
301381 -
人工智能
+關(guān)注
關(guān)注
1817文章
50097瀏覽量
265317
發(fā)布評(píng)論請(qǐng)先 登錄
人形機(jī)器人 3D 視覺路線之爭(zhēng):激光雷達(dá)、雙目和 3D - ToF 誰更勝一籌?
基于3D視覺引導(dǎo)的移動(dòng)式復(fù)合機(jī)器人設(shè)計(jì):智能自動(dòng)化革命的核心技術(shù)
瑞聲科技為豆包AI手機(jī)提供核心感知能力支撐
3D 視覺系統(tǒng)供應(yīng)商全景解析:技術(shù)迭代與國產(chǎn)力量的崛起
立體視覺和激光雷達(dá)在3D智駕感知領(lǐng)域的差異分析
奧比中光3D視覺技術(shù)賦能IROS 2025研究成果
奧比中光領(lǐng)跑韓國機(jī)器人3D視覺市場(chǎng)
Socionext推出3D芯片堆疊與5.5D封裝技術(shù)
季豐電子邀您相約2025國際3D視覺感知與應(yīng)用大會(huì)
iTOF技術(shù),多樣化的3D視覺應(yīng)用
索尼與VAST達(dá)成3D業(yè)務(wù)合作
3D視覺引領(lǐng)工業(yè)變革
基于NVIDIA AI的3D機(jī)器人感知與地圖構(gòu)建系統(tǒng)設(shè)計(jì)
NVIDIA助力影眸科技3D生成工具Rodin升級(jí)
昨日,杭州3D視覺傳感器公司獲數(shù)億元融資!
英國利用AI技術(shù)將時(shí)間轉(zhuǎn)換為3D空間視覺,助力研發(fā)移動(dòng)設(shè)備的感知能力
評(píng)論