現(xiàn)在,AI可以把人類腦中的信息,用高清視頻展示出來(lái)了!
例如你坐在副駕所欣賞到的沿途美景信息,AI分分鐘給重建了出來(lái):

看到過(guò)的水中的魚(yú)兒、草原上的馬兒,也不在話下:


這就是由新加坡國(guó)立大學(xué)和香港中文大學(xué)共同完成的最新研究,團(tuán)隊(duì)將項(xiàng)目取名為MinD-Video。

Cinematic Mindscapes: High-quality Video Reconstruction from Brain Activity 主頁(yè):https://mind-video.com/ 論文:https://arxiv.org/abs/2305.11675 代碼:https://github.com/jqin4749/MindVideo
這波操作,宛如科幻電影《超體》中Lucy讀取反派大佬記憶一般:

引得網(wǎng)友直呼:
推動(dòng)人工智能和神經(jīng)科學(xué)的前沿。

值得一提的是,大火的Stable Diffusion也在這次研究中立了不小的功勞。

怎么做到的?
從大腦活動(dòng)中重建人類視覺(jué)任務(wù),尤其是功能磁共振成像技術(shù)(fMRI)這種非侵入式方法,一直是受到學(xué)界較多的關(guān)注。
因?yàn)轭愃七@樣的研究,有利于理解我們的認(rèn)知過(guò)程。
但以往的研究都主要聚焦在重建靜態(tài)圖像,而以高清視頻形式來(lái)展現(xiàn)的工作還是較為有限。
之所以會(huì)如此,是因?yàn)榕c重建一張靜態(tài)圖片不同,我們視覺(jué)所看到的場(chǎng)景、動(dòng)作和物體的變化是連續(xù)、多樣化的。
而fMRI這項(xiàng)技術(shù)的本質(zhì)是測(cè)量血氧水平依賴(BOLD)信號(hào),并且在每隔幾秒鐘的時(shí)間里捕捉大腦活動(dòng)的快照。
相比之下,一個(gè)典型的視頻每秒大約包含30幀畫面,如果要用fMRI去重建一個(gè)2秒的視頻,就需要呈現(xiàn)起碼60幀。
因此,這項(xiàng)任務(wù)的難點(diǎn)就在于解碼fMRI并以遠(yuǎn)高于fMRI時(shí)間分辨率的FPS恢復(fù)視頻。
為了彌合圖像和視頻大腦解碼之間差距,研究團(tuán)隊(duì)便提出了MinD-Video的方法。
整體來(lái)看,這個(gè)方法主要包含兩大模塊,它們分別做訓(xùn)練,然后再在一起做微調(diào)。

這個(gè)模型從大腦信號(hào)中逐步學(xué)習(xí),在第一個(gè)模塊多個(gè)階段的過(guò)程,可以獲得對(duì)語(yǔ)義空間的更深入理解。
具體而言,便是先利用大規(guī)模無(wú)監(jiān)督學(xué)習(xí)與mask brain modeling(MBM)來(lái)學(xué)習(xí)一般的視覺(jué)fMRI特征。
然后,團(tuán)隊(duì)使用標(biāo)注數(shù)據(jù)集的多模態(tài)提取語(yǔ)義相關(guān)特征,在對(duì)比語(yǔ)言-圖像預(yù)訓(xùn)練(CLIP)空間中使用對(duì)比學(xué)習(xí)訓(xùn)練fMRI編碼器。
在第二個(gè)模塊中,團(tuán)隊(duì)通過(guò)與增強(qiáng)版Stable Diffusion模型的共同訓(xùn)練來(lái)微調(diào)學(xué)習(xí)到的特征,這個(gè)模型是專門為fMRI技術(shù)下的視頻生成量身定制的。
如此方法之下,團(tuán)隊(duì)也與此前的諸多研究做了對(duì)比,可以明顯地看到MinD-Video方法所生成的圖片、視頻質(zhì)量要遠(yuǎn)優(yōu)于其它方法。

而且在場(chǎng)景連續(xù)變化的過(guò)程中,也能夠呈現(xiàn)高清、有意義的連續(xù)幀。

研究團(tuán)隊(duì)
這項(xiàng)研究的共同一作,其中一位是來(lái)自新加坡國(guó)立大學(xué)的博士生Zijiao Chen,目前在該校的神經(jīng)精神疾病多模式神經(jīng)成像實(shí)驗(yàn)室(MNNDL_Lab)。
另一位一作則是來(lái)自香港中文大學(xué)的Jiaxin Qing,就讀專業(yè)是信息工程系。
除此之外,通訊作者是新加坡國(guó)立大學(xué)副教授Juan Helen ZHOU。
據(jù)了解,這次的新研究是他們團(tuán)隊(duì)在此前一項(xiàng)名為MinD-Vis的功能磁共振成像圖像重建工作的延伸。
MinD-Vis已經(jīng)被CVPR 2023所接收。

審核編輯 :李倩
-
AI
+關(guān)注
關(guān)注
91文章
39762瀏覽量
301366 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265302 -
視覺(jué)
+關(guān)注
關(guān)注
1文章
179瀏覽量
24802
發(fā)布評(píng)論請(qǐng)先 登錄
CM8236G+CM2001M:MIPI信號(hào)驅(qū)動(dòng)工業(yè)視覺(jué)升級(jí)
如何挑選一款gps北斗導(dǎo)航衛(wèi)星信號(hào)模擬器 導(dǎo)航衛(wèi)星模擬器 gps模擬信號(hào)發(fā)生器
本地部署Stable Diffusion實(shí)現(xiàn)AI文字生成高質(zhì)量矢量圖片應(yīng)用于電子商務(wù)
工業(yè)4.0的“數(shù)據(jù)橋梁”:圖像采集卡如何撐起智能制造的視覺(jué)核心
工業(yè)圖像采集卡:機(jī)器視覺(jué)的“信號(hào)中樞”
什么是太陽(yáng)光譜?如何在實(shí)驗(yàn)室復(fù)現(xiàn)太陽(yáng)光?
圖像采集卡重要功能解析:打通視頻信號(hào)處理全鏈路
從信號(hào)處理到視覺(jué)感知:CM2001AT 與 索尼FCB-EV9520L 驅(qū)動(dòng)車載智能升級(jí)
視頻信號(hào)延長(zhǎng)方案
是德N5173B信號(hào)發(fā)生器在EMC測(cè)試中的干擾信號(hào)精準(zhǔn)復(fù)現(xiàn)技巧
將大腦的能力發(fā)揮到極致
?Diffusion生成式動(dòng)作引擎技術(shù)解析
IGBT模塊的反向恢復(fù)現(xiàn)象
使用OpenVINO GenAI和LoRA適配器進(jìn)行圖像生成
驚!大腦視覺(jué)信號(hào)被Stable Diffusion復(fù)現(xiàn)成視頻!
評(píng)論